ওয়েব ক্যাপচার এবং রূপান্তর করার সরঞ্জামসমূহ

কোনও ওয়েবসাইট থেকে ইমেল ঠিকানাগুলি স্ক্র্যাপ করুন

নিম্নলিখিত দুটি উদাহরণ একই অংশ টেমপ্লেট.

গ্র্যাবআইটি'র ওয়েব স্ক্র্যাপার কোনও ওয়েবসাইট থেকে ইমেল ঠিকানাগুলি সরানো সহজ করার জন্য বেশ কয়েকটি বিশেষ ইউটিলিটি পদ্ধতি সরবরাহ করে। নীচের উদাহরণটি একটি ওয়েব পৃষ্ঠা থেকে সমস্ত HTML সামগ্রী পায় এবং তারপরে এটি পাস করে Utility.Text.extractAddresses ঠিকানাগুলি সংরক্ষণ করার আগে সমস্ত বৈধ ইমেল ঠিকানাগুলি সন্ধান করার পদ্ধতি intওএ ডাটাসেট, যা ব্যবহারকারীকে পরে প্রেরণ করা হয়।

বিকল্পভাবে কেবল প্রথম মিলের ইমেল ঠিকানা ব্যবহার করে বের করা যেতে পারে Utility.Text.extractAddress পদ্ধতি।

Data.save(Utility.Text.extractAddresses(Page.getHtml()));

পিডিএফ ডকুমেন্টগুলি থেকে ইমেল ঠিকানাগুলি স্ক্র্যাপ করুন

পিডিএফ ডকুমেন্টগুলিও স্ক্র্যাপ করা যায় ইমেল ঠিকানাগুলির জন্য ওয়েব পৃষ্ঠাগুলি কীভাবে উপরে স্ক্র্যাপ করা হয় একই পদ্ধতিতে। আপনি নীচের উদাহরণে দেখতে পারেন প্রক্রিয়াটি বাদে প্রক্রিয়াটি হুবহু একই PDF.getText() পরিবর্তে পদ্ধতি ব্যবহার করা হয় Page.getHtml() পদ্ধতি।

Data.save(Utility.Text.extractAddresses(PDF.getText()));

চিত্রগুলি থেকে ইমেল ঠিকানাগুলি স্ক্র্যাপ করুন

গ্র্যাবজিট এর ক্ষমতা রাখে ছবি থেকে পাঠ্য নিষ্কাশন এর অর্থ এই যে চিত্রগুলি থেকে ইমেল ঠিকানাগুলি বের করতে এই ক্ষমতাটিও ব্যবহার করা যেতে পারে। নীচের উদাহরণটি ওয়েব পৃষ্ঠায় সমস্ত চিত্র থেকে কোনও ইমেল ঠিকানা বের করে।

Data.save(Utility.Text.extractAddresses(Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}))));

নীচের স্ক্র্যাপ নির্দেশাবলী পিডিএফ ডকুমেন্টগুলিতে পাওয়া চিত্রগুলি থেকে কোনও ইমেল অ্যাড্রেসগুলি বের করুন।

Data.save(Utility.Text.extractAddresses(Utility.Image.extractText(PDF.getValue({"type":"image"}))));