ওয়েব ক্যাপচার এবং রূপান্তর করার সরঞ্জামসমূহ

ডেটা বের করুন এবং এটি রূপান্তর করুন intওএ ডাটাসেট

সর্বাধিক প্রচলিত প্রয়োজনীয়তাগুলির মধ্যে একটি হ'ল কোনও ওয়েবসাইট থেকে ডেটা উত্তোলন এবং এটিকে চালু করা intoa সারণী কাঠামো যা আরও প্রক্রিয়াজাতকরণের জন্য রফতানি করা যায়। তবে কেবল একটি ডেটাসেট কী এবং এটি কীভাবে ব্যবহৃত হয় গ্র্যাবআইটি'র ওয়েব স্ক্র্যাপার?

উদাহরণস্বরূপ ডেটাসেট: মূল্য তালিকা

নীচে ডাটাবেসে থাকা টেবিলের তথ্য রয়েছে মূল্য তালিকা, টেবিলটিতে তিনটি কলাম রয়েছে আইটেম লেবেল, বস্তুর বর্ণনা এবং আইটেম দাম.

আইটেম লেবেল বস্তুর বর্ণনা আইটেম দাম
ক্যামেরা ডিজিটাল ফটো নেয় $ 99.00

এই ডেটাসেটটি তৈরি করতে আপনাকে নিম্নলিখিত স্ক্র্যাপ নির্দেশাবলী ব্যবহার করতে হবে।

Data.save('Camera', 'price list', 'item label');
Data.save('Takes digital photos', 'price list', 'item description');
Data.save('$99.00', 'price list', 'item price');

এটি ব্যবহার করে Data.save পদ্ধতি যুক্ত করার জন্য একটি তথ্য মান একটি বিশেষ ডেটা সেটটি এবং স্তম্ভ। প্রতিবার Data.save পদ্ধতিটি একই ডেটাसेट এবং কলাম নামের পরামিতিগুলির সাথে কল করা হয় that কলামটিতে একটি নতুন সারি যুক্ত করা হয়। তবে উপরের স্ক্র্যাপের নির্দেশাবলী খুব কার্যকর নয় কারণ আমরা স্থির মান ব্যবহার করে ডেটাসেট তৈরি করছি। নীচের কোডটি একটি ওয়েবপৃষ্ঠার এইচটিএমএল দেখায়, এরপরে পৃষ্ঠা থেকে ডেটা গতিশীলভাবে বের করার জন্য আমরা স্ক্র্যাপের নির্দেশাবলী লিখব এবং save it intওএ ডাটাসেট

<html>
    <body>
        <span id="spnLabel">Nikon 1055</span>
        <span id="spnDescription">Great little camera, creates clear sharp images.</span>
        <span id="spnPrice">$99.99</span>
    </body>
</html>

আমরা এখন ব্যবহার করব Page.getTagValue স্প্যান ট্যাগগুলি থেকে মানগুলি বের করার পদ্ধতি।

Data.save(Page.getTagValue({"id":{"equals":"spnLabel"}}), 'price list', 'item label');
Data.save(Page.getTagValue({"id":{"equals":"spnDescription"}}), 'price list', 'item description');
Data.save(Page.getTagValue({"id":{"equals":"spnPrice"}}), 'price list', 'item price');

আপনি দেখতে পারেন Page.getTagValue পদ্ধতিগুলি একটি ফিল্টার ব্যবহার করে, যা এইচটিএমএল উপাদানটি অনন্যভাবে চিহ্নিত করে যা পাঠ্যটি বের করা দরকার। এই ক্ষেত্রে ফিল্টারগুলি নির্দিষ্ট করে দিচ্ছে যে আইডি এইচটিএমএল বৈশিষ্ট্যটি সমান হওয়া উচিত spnLabel, spnDescription or spnPrice যথাক্রমে। আপনি সহজেই ক্লিক করে একটি ফিল্টার তৈরি করতে পারেন ফিল্টার বোতাম আইকন, যা ফিল্টারটির নির্মাণকাজ সহজ করার জন্য একটি উইজার্ড প্রদর্শন করে।

আমরা এখানে যেমন দেখিয়েছিলে আপনি নিজের ডেটাसेटটি তৈরি করে ফেললে আপনি কীভাবে এটিতে রফতানি করতে চান তা সিদ্ধান্ত নিতে পারেন রফতানির বিকল্প ট্যাব।