ওয়েব ক্যাপচার এবং রূপান্তর করার সরঞ্জামসমূহ

কোনও ওয়েবসাইট থেকে লিঙ্কগুলি বের করুন

এই উদাহরণটি একটি হিসাবেও উপলব্ধ টেমপ্লেট.

একটি সাধারণ কাজ হ'ল একটি ওয়েবসাইট থেকে লিঙ্কগুলি বের করা, বিশেষত এইচটিএমএল লিঙ্কগুলি। ভাগ্যক্রমে ব্যবহার করার সময় এটি সহজ গ্র্যাবআইটি'র ওয়েব স্ক্র্যাপার। প্রথমে সাধারণ বিবরণ যেমন স্ক্র্যাপের প্রারম্ভিক পৃষ্ঠা এবং অন্য কোনও বিকল্পের সাথে একটি নতুন স্ক্র্যাপ তৈরি করুন।

তারপর যান স্ক্র্যাপ নির্দেশাবলী ট্যাব এবং ক্লিক করুন ওয়েব পৃষ্ঠা বোতাম বোতাম। এটি প্রবেশ করবে Page শব্দ into স্ক্র্যাপ নির্দেশাবলী এবং একটি ড্রপ ডাউন খুলবে। নির্বাচন করা getTagAttributes তালিকা থেকে। পরবর্তী অ্যাড 'href' প্রথম প্যারামিটার হিসাবে, এটি ওয়েব স্ক্র্যাপারকে href বৈশিষ্ট্যটি বের করতে বলে, তারপরে একটি কমা লিখুন।

পরবর্তী ক্লিক করুন ফিল্টার বোতাম এটি আপনাকে ওয়েব স্ক্র্যাপারকে জানাতে মঞ্জুরি দেয় যাতে কোন উপাদানগুলি থেকে href বৈশিষ্ট্যটি বের করা যায়। ফিল্টার উইন্ডোতে টাইপটি 'ওয়েব পৃষ্ঠা' তে সেট করা আছে এবং সীমাবদ্ধতাটি 'ট্যাগের নাম' এবং 'সমান' হয়ে থাকে তা নিশ্চিত করুন। তারপরে প্রবেশ করুন a পাঠ্য বাক্সে এবং তারপরে অ্যাড বোতামটি ক্লিক করুন এবং তারপরে ফিল্টার বোতামটি সন্নিবেশ করুন। লাইনের শেষে একটি আধা-কোলন যুক্ত করে নির্দেশ শেষ করুন।

নীচে দেখানো মত কিছু আপনার রেখে দেওয়া উচিত।

Page.getTagAttributes('href', {"tag":{"equals":"a"}});

উপরের কোডটি ওয়েব লিঙ্ক থেকে সমস্ত লিঙ্কের ইউআরএল বের করবে, তবে আমাদের এখন প্রয়োজন save যারা লিঙ্ক ইউআরএল। এটি করার জন্য আমরা এই কমান্ডটি আধা-কোলন বিয়োগ করে একটি এ এড়িয়ে যাব Data.save কমান্ড। এটি করতে লাইনের শুরুতে যান এবং এটি নির্বাচন করুন ডাটা বোতাম বোতাম। তারপরে ড্রপ ডাউন এ সিলেক্ট করুন save, তারপরে লাইনের শেষে যান এবং কমা যুক্ত করুন। তারপরে আপনি ডেটাসেটটি যেমন 'আমার ওয়েবসাইট' কল করতে চান তা যুক্ত করুন, তারপরে অন্য কমা যুক্ত করুন এবং তারপরে 'লিংকস' এর মতো কলামটি বর্ণনা করার জন্য অন্য একটি পরামিতি যুক্ত করুন এবং তারপরে কমান্ডটি বন্ধ করুন ) আধা-কোলনের আগে

আপনার এখন নিম্নলিখিত স্ক্র্যাপ নির্দেশাবলী থাকা উচিত।

Data.save(Page.getTagAttributes('href', {"tag":{"equals":"a"}}), 'My Websites', 'Links');

এখন আপনি যদি স্ক্র্যাপটি চালান তবে আপনি ওয়েবসাইট থেকে সমস্ত লিঙ্ক বের করবেন। এটি আমার ওয়েবসাইটগুলির নামের সাথে একটি লিঙ্কের কলামের নাম সহ একটি সারণী তৈরি করবে যা পরে রফতানি হতে পারে into অনেকগুলি আলাদা ফর্ম্যাট যেমন এক্সএমএল, সিএসভি বা স্প্রেডশিট। এই টিউটোরিয়ালটি স্ক্র্যাপ নির্দেশিকা সরঞ্জামদণ্ডে উইজার্ড বোতামটি ব্যবহার করেও অর্জন করা যেতে পারে।