প্রায়শই গুরুত্বপূর্ণ পাঠ্য তথ্য চিত্রগুলিতে সংরক্ষণ করা যেতে পারে। যাহোক গ্র্যাবআইটি'র ওয়েব স্ক্র্যাপার অপটিক্যাল ক্যারেক্টার রিকগনিশন ব্যবহার করে এই তথ্যটি স্বয়ংক্রিয়ভাবে উত্তোলনের ক্ষমতা সরবরাহ করে। যদিও এটি শৈল্পিক একটি ফর্ম intউদ্দীপনা ফলাফল সর্বদা নিখুঁত হয় না।
চিত্রগুলি থেকে পাঠ্য বের করতে আপনার ব্যবহার করা উচিত Utility.Image.extractText
নীচে প্রদর্শিত পদ্ধতি।
var textArray = Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}));
এই উদাহরণগুলি উভয়ই ওয়েব পৃষ্ঠা থেকে সমস্ত চিত্রের ইউআরএল পেয়ে থাকে এবং তারপরে ইউআরএলগুলি এক্সট্রাক্ট টেক্সট পদ্ধতিতে দেয় যা প্রতিটি চিত্র থেকে পাঠ্য ডেটা বের করার চেষ্টা করে এবং কোনও মিলকে অ্যারের হিসাবে পাস করে দেয় strings.
চিত্রের পাঠ্যটি যদি অন্য ভাষায় হয় তবে নীচের চিত্রের মতো দুটি অক্ষরের (আইএসও 639-1) ফর্ম্যাট ব্যবহার করে আপনাকে সঠিক ভাষা কোড নির্দিষ্ট করতে হবে।
var textArray = Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}), 'fr');