ওয়েব ক্যাপচার এবং রূপান্তর করার সরঞ্জামসমূহ
কিভাবে intরাপ্রোক্সি সক্ষম করে intরেনেট স্ক্রিনশট

ক্যাপচারিং বা স্ক্র্যাপিং Intরেনেট এবং লোকালহোস্ট ওয়েবসাইটগুলি

An intরানেট ওয়েবসাইট অন্য যে কোনও ওয়েবসাইটের মতোই গুরুত্বপূর্ণ হতে পারে এবং স্ক্রিনশটিং, স্ক্র্যাপিং বা রূপান্তরকরণের প্রয়োজন হতে পারে intও অফলাইন সংস্করণ। দুর্ভাগ্যক্রমে, ক্যাপচারিং একটি intওয়েবে একটি সাধারণ ওয়েবসাইটের স্ক্রিনশট নেওয়ার চেয়ে রানেট বা লোকালহোস্ট ওয়েবসাইট আরও জটিল।

এটি করার সহজ উপায় হ'ল গ্র্যাবিজআইটি ব্যবহার করা IntraProxy, যা আপনার সমস্ত খুলে দেয় intশুধুমাত্র গ্র্যাবআইটি'র সার্ভারগুলিতে ওয়েবসাইটগুলি। দ্য IntraProxy এর পরে আপনার কাছে এবং থেকে অনুরোধগুলির রাউটিং পরিচালনা করে intডায়াগ্রামে যেমন দেখানো হয়েছে তেমনি আপনার জন্য ওয়েবসাইটগুলি n

ব্যবহারকারীদের সুরক্ষা সম্পর্কে আশ্বাস দেওয়া IntraProxy আমরা কোড তৈরি করেছি ওপেন সোর্স উভয়ই লোকেরা এটি কী করছে তা দেখতে এবং বাগ ফিক্সগুলি এবং আরও উন্নতিকে উত্সাহিত করতে পারে।

প্রথম গিথুব থেকে প্রক্সি ডাউনলোড করুন। আপনার জাভা 1.6+ ইনস্টল থাকা দরকার। তারপরে কমান্ড লাইন ব্যবহার করে ডিরেক্টরিটি অন্তর্ভুক্ত করুন intraproxy.jar। তারপরে নিম্নলিখিত কমান্ডটি ব্যবহার করুন।

java -jar "intraproxy.jar" 

পরবর্তী, আপনি দেখতে পারেন কিনা IntraProxy চলছে তখন আপনার রাউটারে পোর্ট 10000 মেশিনের আইপি ঠিকানায় GrabzIt এ ফরোয়ার্ড করুন IntraProxy চালু আছে। এটি কীভাবে করবেন তা দয়া করে আমাদের জিজ্ঞাসা করবেন না, আপনার রাউটারটি কনফিগার করার তথ্য ওপরে পাওয়া উচিত Internet।

দেখুন http://localhost:10000/grabzit://dashboard.html কীভাবে কনফিগার করতে এবং ব্যবহার করতে হয় সে সম্পর্কে আরও তথ্যের জন্য IntraProxy।

এটি একবার কনফিগার হয়ে গেলে এটি আমাদের সহ আমাদের সমস্ত সরঞ্জাম ব্যবহার করতে পারে এপিআই, স্ক্রিনশট সরঞ্জাম এবং ওয়েব স্ক্র্যাপার। রাউটারের আইপি ঠিকানা এবং বন্দরের সমস্ত অনুরোধগুলি এখন সঠিক সমাধান করবে intআর্নাল ওয়েবসাইট। উদাহরণস্বরূপ, যদি আপনার ওয়েবসাইটটি অবস্থিত থাকে http://localhost/mywebsite/index.html এবং আপনার রাউটারের আইপি ঠিকানাটি 123.123.123.123 তারপরে বাহ্যিকভাবে আপনার ওয়েবসাইটটি সমাধান করতে আপনি পাস করতে পারেন http://123.123.123.123:10000/http://localhost/mywebsite/index.html GrabzIt এর API বা সরঞ্জামগুলিতে।

একইভাবে, আপনার যদি গ্রাবাজিটডিমো স্থানীয়ভাবে ইনস্টল থাকে এবং এর কলব্যাক হ্যান্ডলারটি কী কল করতে পারে http://localhost/GrabzItDemo/handler.php আপনি পাস করতে পারে http://123.123.123.123:10000/http://localhost/GrabzItDemo/handler.php কলব্যাক হ্যান্ডলার URL হিসাবে।

আপনি যদি আপনার ওয়েবসাইটটি সর্বজনীনভাবে উপলভ্য করে থাকেন তবে এই URL টির পূর্ব উপকরণটি সরিয়ে ফেলতে ভুলবেন না Intআরনেট!

আবশ্যকতা

একটি বিকল্প পদ্ধতি

জন্য intরেনেট বা লোকালহোস্ট ওয়েবসাইটগুলিতে পরম URL নেইintসিএসএস, ইমেজ এবং জাভাস্ক্রিপ্ট ফাইলগুলির মতো সংস্থাগুলিতে আইএনজি প্রবেশ করানো যায় না Intআপনার নিকটে পোর্ট ফরওয়ার্ডিং সেটআপ করা সহজ নেট অপশন intআর্নাল ওয়েবসাইট। তবে আপনাকে কেবল সেই ওয়েবসাইটগুলির জন্য এটি করা উচিত যা আপনার কাছে খোলার আপত্তি মনে করে না Internet তদুপরি, আপনার যদি বিপুল সংখ্যক থাকে তবে এটি সম্ভবত উপযুক্ত হবে না intওয়েবসাইটগুলি ক্যাপচার।

আপনার রাউটারে আপনাকে লগ ইন করতে হবে এবং রাউটারগুলির আইপি ঠিকানা এবং আপনার ওয়েবসাইট হোস্ট করা কম্পিউটারে পোর্ট থেকে আগত সমস্ত অনুরোধগুলি ফরোয়ার্ড করার জন্য একটি পোর্ট ফরওয়ার্ডিং নিয়ম যুক্ত করতে হবে। তারপরে আপনি যে পোর্টটি ফরোয়ার্ড করছেন তার উপর কল গ্রহণের জন্য আপনাকে আপনার ওয়েব সার্ভারটি কনফিগার করতে হবে।

উদাহরণস্বরূপ, যদি আপনার রাউটারের আইপি ঠিকানা হয় 222.222.222.222 আপনি ওয়েবসাইটটি হোস্ট করে এমন কম্পিউটারে 12345 পোর্টের জন্য একটি পোর্ট ফরওয়ার্ডিং যুক্ত করতে এবং এটি শুনতে পোর্টগুলির মধ্যে একটি হিসাবে আপনার ওয়েব সার্ভার কনফিগারেশনে এই পোর্টটি যুক্ত করতে পারেন।

আপনার ওয়েব সার্ভার এবং রাউটারটি কীভাবে কনফিগার করতে হবে সে সম্পর্কে আরও তথ্য পাওয়া উচিত internet। একবার এটি ঠিকানার মতো কল করা শেষ হয়ে যায় http://222.222.222.222:12345/mypage.html আপনার ওয়েবসাইট লোড করা উচিত।