ওয়েব ক্যাপচার এবং রূপান্তর করার সরঞ্জামসমূহ
কিভাবে intরাপ্রোক্সি সক্ষম করে intরেনেট স্ক্রিনশট

ইন্ট্রানেট এবং লোকালহোস্ট ওয়েবসাইট ক্যাপচার বা স্ক্র্যাপিং

An intরানেট ওয়েবসাইট অন্য যে কোনও ওয়েবসাইটের মতোই গুরুত্বপূর্ণ হতে পারে এবং স্ক্রিনশটিং, স্ক্র্যাপিং বা রূপান্তরকরণের প্রয়োজন হতে পারে intও অফলাইন সংস্করণ। দুর্ভাগ্যক্রমে, ক্যাপচারিং একটি intওয়েবে একটি সাধারণ ওয়েবসাইটের স্ক্রিনশট নেওয়ার চেয়ে রানেট বা লোকালহোস্ট ওয়েবসাইট আরও জটিল।

এটি করার সহজতম উপায় হ'ল গ্র্যাবিজআইটি'র ইন্ট্রোপ্রক্সি ব্যবহার করা যা আপনার সমস্তটি খুলে দেয় intশুধুমাত্র গ্র্যাবআইটি'র সার্ভারগুলিতে ওয়েবসাইটগুলি। ইন্ট্রাপ্রক্সি তারপরে আপনার কাছে এবং থেকে অনুরোধগুলির রাউটিং পরিচালনা করে intডায়াগ্রামে যেমন দেখানো হয়েছে তেমনি আপনার জন্য ওয়েবসাইটগুলি n

ব্যবহারকারীদের ইন্ট্রাপ্রক্সির সুরক্ষার আশ্বাস দেওয়ার জন্য আমরা কোডটি তৈরি করেছি ওপেন সোর্স উভয়ই লোকেরা এটি কী করছে তা দেখতে এবং বাগ ফিক্সগুলি এবং আরও উন্নতিকে উত্সাহিত করতে পারে।

প্রথম গিথুব থেকে প্রক্সি ডাউনলোড করুন। আপনার জাভা 1.6+ ইনস্টল থাকা দরকার। তারপরে কমান্ড লাইন ব্যবহার করে ডিরেক্টরিটি অন্তর্ভুক্ত করুন intraproxy.jar। তারপরে নিম্নলিখিত কমান্ডটি ব্যবহার করুন।

java -jar "intraproxy.jar" 

এরপরে, আপনি দেখতে পাচ্ছেন যে আপনার রাউটারটিতে 10000 পোর্টটি মেশিনের আইপি ঠিকানায় ফরোয়ার্ড করে গ্রাবাজিট ইন্ট্রাপ্রক্সি ইনস্টল করা আছে কিনা তা দিয়ে আপনি যদি ইন্ট্রাপ্রক্সি চলমান থাকে। এটি কীভাবে করবেন তা দয়া করে আমাদের জিজ্ঞাসা করবেন না, আপনার রাউটারটি কনফিগার করার তথ্য ইন্টারনেটে পাওয়া উচিত।

দেখুন http://localhost:10000/grabzit://dashboard.html কীভাবে ইন্ট্রাপ্রক্সি কনফিগার করতে এবং ব্যবহার করতে হয় সে সম্পর্কে আরও তথ্যের জন্য।

এটি একবার কনফিগার হয়ে গেলে এটি আমাদের সহ আমাদের সমস্ত সরঞ্জাম ব্যবহার করতে পারে এপিআই, স্ক্রিনশট সরঞ্জাম এবং ওয়েব স্ক্র্যাপার। রাউটারের আইপি ঠিকানা এবং বন্দরের সমস্ত অনুরোধগুলি এখন সঠিক সমাধান করবে intআর্নাল ওয়েবসাইট। উদাহরণস্বরূপ, যদি আপনার ওয়েবসাইটটি অবস্থিত থাকে http://localhost/mywebsite/index.html এবং আপনার রাউটারের আইপি ঠিকানাটি 123.123.123.123 তারপরে বাহ্যিকভাবে আপনার ওয়েবসাইটটি সমাধান করতে আপনি পাস করতে পারেন http://123.123.123.123:10000/http://localhost/mywebsite/index.html GrabzIt এর API বা সরঞ্জামগুলিতে।

একইভাবে, আপনার যদি গ্রাবাজিটডিমো স্থানীয়ভাবে ইনস্টল থাকে এবং এর কলব্যাক হ্যান্ডলারটি কী কল করতে পারে http://localhost/GrabzItDemo/handler.php আপনি পাস করতে পারে http://123.123.123.123:10000/http://localhost/GrabzItDemo/handler.php কলব্যাক হ্যান্ডলার URL হিসাবে।

আপনি যদি আপনার ওয়েবসাইটটি ইন্টারনেটে সর্বজনীনভাবে উপলব্ধ করেন তবে এই ইউআরএল উপসর্গটি সরাতে ভুলবেন না!

আবশ্যকতা

  • কেবল গ্র্যাবিজিট সার্ভার থেকে অ্যাক্সেসের অনুমতি দেয়
  • জাভা 1.6 + প্রয়োজন

একটি বিকল্প পদ্ধতি

জন্য intরেনেট বা লোকালহোস্ট ওয়েবসাইটগুলিতে পরম URL নেইintসিএসএস, ইমেজ এবং জাভাস্ক্রিপ্ট ফাইলগুলির মতো সংস্থানগুলিতে আইং করা, যা ইন্টারনেট সহজতম বিকল্পে অ্যাক্সেসযোগ্য নয় আপনার পোর্ট ফরওয়ার্ডিং সেটআপ করা হবে would intআর্নাল ওয়েবসাইট। তবে আপনাকে কেবল সেই ওয়েবসাইটগুলির জন্য এটি করা উচিত যা ইন্টারনেটে আপ খুলতে আপনার আপত্তি নেই। তদুপরি, আপনার বিপুল সংখ্যক লোক থাকলে এটি সম্ভবত উপযুক্ত হবে না intওয়েবসাইটগুলি ক্যাপচার।

আপনার রাউটারে আপনাকে লগ ইন করতে হবে এবং রাউটারগুলির আইপি ঠিকানা এবং আপনার ওয়েবসাইট হোস্ট করা কম্পিউটারে পোর্ট থেকে আগত সমস্ত অনুরোধগুলি ফরোয়ার্ড করার জন্য একটি পোর্ট ফরওয়ার্ডিং নিয়ম যুক্ত করতে হবে। তারপরে আপনি যে পোর্টটি ফরোয়ার্ড করছেন তার উপর কল গ্রহণের জন্য আপনাকে আপনার ওয়েব সার্ভারটি কনফিগার করতে হবে।

উদাহরণস্বরূপ, যদি আপনার রাউটারের আইপি ঠিকানা হয় 222.222.222.222 আপনি ওয়েবসাইটটি হোস্ট করে এমন কম্পিউটারে 12345 পোর্টের জন্য একটি পোর্ট ফরওয়ার্ডিং যুক্ত করতে এবং এটি শুনতে পোর্টগুলির মধ্যে একটি হিসাবে আপনার ওয়েব সার্ভার কনফিগারেশনে এই পোর্টটি যুক্ত করতে পারেন।

আপনার ওয়েব সার্ভার এবং রাউটারটি কীভাবে কনফিগার করতে হবে সে সম্পর্কে আরও তথ্য পাওয়া উচিত internet। একবার এটি ঠিকানার মতো কল করা শেষ হয়ে যায় http://222.222.222.222:12345/mypage.html আপনার ওয়েবসাইট লোড করা উচিত।