প্রথমে ওয়েব স্ক্র্যাপিং কি? ওয়েব স্ক্র্যাপিং সাধারণত অসংগঠিত ডেটা উত্স থেকে তথ্য বের করতে ব্যবহৃত হয় Intএইচএনএমএল এবং পিডিএফ ডকুমেন্টের মতো ইরनेट।
যেকোন প্রোগ্রামিং ভাষা যা আপনাকে ওয়েব সামগ্রী ডাউনলোড এবং পার্স করতে দেয় তা ওয়েব স্ক্র্যাপ এক্সট্র্যাক্ট করতে ব্যবহার করা যেতে পারে। তবে কয়েকটি সমস্যা রয়েছে, প্রথমটি হল ওয়েব সামগ্রী পড়ার সময়, একটি ব্রাউজার ব্যবহার না করা পর্যন্ত ওয়েব পৃষ্ঠাটি সঠিকভাবে রেন্ডার করা হবে না কারণ কোনো জাভাস্ক্রিপ্ট এবং অন্যান্য গতিশীল বৈশিষ্ট্যগুলি চালানো হবে না। আরেকটি সমস্যা হল যে কোনও সাধারণ স্ক্র্যাপিং সমস্যার সম্মুখীন হলে একটি বিকাশকারীকে সমাধান করতে হবে। যেমন কিভাবে ডাইনামিক লিঙ্কে ক্লিক করতে হয়, ওয়েবসাইটের স্ক্রিনশট নিতে হয় বা ওয়েব পেজের এক অংশ থেকে টেক্সট বের করতে হয়।
অবশ্যই আপনি যদি GrabzIt এর মতো একটি স্ক্র্যাপিং টুল ব্যবহার করেন তবে এই সমস্যাগুলি ইতিমধ্যে সমাধান করা হয়েছে।
এই GrabzIt এর করতে ওয়েব স্ক্র্যাপার একবার বা নিয়মিত চালানো যেতে পারে এমন একটি স্ক্র্যাপ তৈরি করতে আপনাকে সম্পূর্ণ অনলাইন টুল ব্যবহার করে ওয়েব সামগ্রী বের করতে সক্ষম করে intervals
আপনি ওয়েব কন্টেন্ট এক্সট্র্যাক্ট করার আগে আপনাকে একটি ওয়েবসাইট থেকে কোন তথ্য বের করতে চান তা চিহ্নিত করতে হবে। তারপর একটি তৈরি করুন নতুন স্ক্র্যাপ প্রবেশ করান লক্ষ্য ওয়েবসাইট উপরে লক্ষ্য ওয়েবসাইট ট্যাব. পরবর্তী যান স্ক্র্যাপ নির্দেশনা ট্যাব এবং Extract Web Content বিকল্পটি নির্বাচন করুন, তারপর আপনি যে ওয়েবসাইটটি বের করতে চান তার অংশগুলি নির্বাচন করুন। এরপরে এক্সট্রাক্ট করা ওয়েব কন্টেন্টের জন্য একটি উপযুক্ত ডেটাসেট এবং কলামের নাম সেট করুন এবং অতিরিক্ত প্রয়োজনীয় কলাম যোগ করুন। তারপর চাপুন শেষ স্বয়ংক্রিয়ভাবে কমান্ড তৈরি করতে বোতাম এবং এটি যোগ করুন স্ক্র্যাপ নির্দেশাবলী. যদিও উইজার্ডটি বর্তমানে পিডিএফ নথি বা চিত্রগুলি থেকে স্ক্র্যাপ কমান্ড তৈরি করা সমর্থন করে না তখনও এটি প্রয়োজনীয় স্ক্র্যাপ কমান্ড ম্যানুয়ালি লিখে করা যেতে পারে।
থেকে আপনার প্রয়োজন কোন বিকল্প চয়ন করুন স্ক্র্যাপ অপশন ট্যাব যেমন এই স্ক্র্যাপের জন্য একটি শিরোনাম প্রবেশ করান। এবার সিলেক্ট করুন এক্সপোর্ট অপশন ট্যাব এবং সিএসভি, এইচটিএমএল বা ক-এর মতো ডেটা রপ্তানি করতে চান এমন বিন্যাস চয়ন করুন৷ মাইক্রোসফট এক্সেল নথি।
স্ক্র্যাপ সম্পূর্ণ হলে আপনি যা ঘটতে চান তা আপনার প্রয়োজন যেমন ইমেল দ্বারা অবহিত করা। অথবা ফলাফল পাঠানোর মত কোথাও a ড্রপবক্স or FTP- র অ্যাকাউন্ট বা intআমাদের ব্যবহার করে আপনার অ্যাপ্লিকেশনের সাথে এটিকে এগ্রেট করা হচ্ছে স্ক্র্যাপ API নির্বাচন করে কলব্যাক ইউআরএল বিকল্প আপনার আবেদনে সরাসরি ফলাফল পাঠাতে।
অবশেষে যান তফসিল স্ক্র্যাপ কখন স্ক্র্যাপ শুরু করা উচিত এবং বারবার কল করা উচিত কিনা তা নির্ধারণ করতে। তারপর save স্ক্র্যাপ ওয়েব ডেটা বের করা শুরু করতে!