ওয়েব ক্যাপচার এবং রূপান্তর করার সরঞ্জামসমূহ

ওয়েব স্ক্র্যাপার ডকুমেন্টেশন

এটি আমাদের বিশেষ স্ক্র্যাপ নির্দেশের পদ্ধতিগুলির একটি সংক্ষিপ্তসার যা আমরা আমাদের ওয়েব স্ক্র্যাপের মাধ্যমে উপলব্ধ করি।

Criteria.apply (অ্যারে)

সরবরাহ করা অ্যারে থেকে এই মানদণ্ডে পূর্ববর্তী ক্রিয়াকলাপগুলি দ্বারা সরানো আইটেমগুলির মতো একই স্থানে যে কোনও আইটেম সরিয়ে দেয়।

  • অ্যারে - প্রয়োজনীয়, অ্যারে পরিবর্তনগুলি প্রয়োগ করতে।

Criteria.ascending (মান)

আরোহী ক্রমে মানগুলি প্রদান করে।

  • মান - প্রয়োজনীয়, একটি ক্রয় যা আপনি আরোহী ক্রম অনুসারে বাছাই করতে চান তা পাস করুন।

ক্রেটারিয়া.সামগ্রী (সূঁচ, মান)

শুধুমাত্র সূঁচ অ্যারের আইটেমগুলিতে নির্দিষ্ট মান থাকে Return

  • সূঁচ - প্রয়োজনীয়, ফিল্টার করার জন্য অ্যারে।
  • মান - প্রয়োজনীয়, মান আইটেম অবশ্যই থাকতে হবে।

Criteria.create (অ্যারে)

একটি নতুন অ্যারেতে ক্রিয়া সম্পাদনের জন্য প্রস্তুত একটি নতুন মানদণ্ড তৈরি করে।

  • অ্যারে - প্রয়োজনীয়, কলামগুলির অ্যারে পরিবর্তনগুলি প্রয়োগ করতে।

  • Criteria.descending (মান)

    অবতরণ ক্রমে মানগুলি প্রদান করে।

    • মান - প্রয়োজনীয়, এমন একটি অ্যারে পাস করুন যা আপনি অবতরণ ক্রমে বাছাই করতে চান।

    ক্রিটারিয়া.ইকোয়্যালস (সূঁচ, মান)

    শুধুমাত্র সূঁচ অ্যারেতে আইটেমগুলি দেয় যা নির্দিষ্ট মানটির সমান হয়।

    • সূঁচ - প্রয়োজনীয়, ফিল্টার করার জন্য অ্যারে।
    • মান - প্রয়োজনীয়, মান আইটেমের সমান হতে হবে।

    মানদণ্ড.অক্ষেত্র (অ্যারে, প্যাটার্ন)

    অ্যারেতে থাকা সমস্ত আইটেম ফিরে আসে যা নির্দিষ্ট প্যাটার্ন অনুসারে কোনও ম্যাচ ছাঁটাই করে।

    • অ্যারে - প্রয়োজনীয়, অ্যারে ম্যাচ ছাঁটাই করতে।
    • প্যাটার্ন - প্রয়োজনীয়, প্যাটার্নটি কীভাবে ফেরত পাঠ্যের পছন্দসই অংশটি ছাঁটাতে হবে তা নির্ধারণ করে। ছাঁটাইয়ের মানটি নিদর্শনটিতে UE AL VALUE} by দ্বারা নির্দেশিত।
      উদাহরণস্বরূপ 'আমার বয়স 33' থেকে বয়সটি ছাঁটাই করা। 'আমার বয়স {AL মান UE}'} ব্যবহার করা হবে।

    ক্রিটারিয়া.greaterThan (সূঁচ, মান)

    সূঁচ অ্যারেতে কেবলমাত্র আইটেমগুলি নির্দিষ্ট মানের চেয়ে বড় are

    • সূঁচ - প্রয়োজনীয়, ফিল্টার করার জন্য অ্যারে।
    • মান - প্রয়োজনীয়, মান আইটেমগুলির চেয়ে বড় হওয়া আবশ্যক।

    মানদণ্ড.কিপ (সূঁচ, খড়ের ছিদ্র)

    খড়ের ছাঁচে অ্যারে পাওয়া কোনও মিল রাখার পরে সূঁচের অ্যারে ফেরত দেয়।

    • সূঁচ - প্রয়োজনীয়, ফিল্টার করার জন্য অ্যারে।
    • খড়ের খালি - প্রয়োজনীয়, অ্যারে ব্যবহার করে সূঁচ রাখার জন্য।

    ক্রেটারিয়া.বিহীন থান (সূঁচ, মান)

    সূঁচ অ্যারেতে কেবলমাত্র আইটেমগুলি নির্দিষ্ট মান থেকে কম হয় তা ফেরত দেয়।

    • সূঁচ - প্রয়োজনীয়, ফিল্টার করার জন্য অ্যারে।
    • মান - প্রয়োজনীয়, মান আইটেমের চেয়ে কম হওয়া আবশ্যক।

    মানদণ্ড.লিট (মান, সীমা)

    প্রথম এন মানগুলি প্রদান করে, এন হ'ল সীমা পরিবর্তনশীল।

    • মান - প্রয়োজনীয়, আপনি সীমাবদ্ধ করতে চান এমন একটি অ্যারে পাস করুন।
    • সীমা - প্রয়োজনীয়, আপনি অ্যারে থেকে ফিরে আসতে চান এমন মানের সংখ্যা।

    মানদণ্ড.নোটইকোয়েলস (সূঁচ, মান)

    সূঁচ অ্যারেতে কেবলমাত্র আইটেমগুলি দেয় যা নির্দিষ্ট মানটির সাথে সমান হয় না।

    • সূঁচ - প্রয়োজনীয়, ফিল্টার করার জন্য অ্যারে।
    • মান - প্রয়োজনীয়, মান আইটেমের সমান নয়।

    মানদণ্ড.আরমোভ (সূঁচ, খড়ের ছিদ্র)

    খড়ের ছাঁচের অ্যারেটিতে পাওয়া কোনও ম্যাচ অপসারণের পরে সূঁচের অ্যারে ফিরিয়ে দেয়।

    • সূঁচ - প্রয়োজনীয়, ফিল্টার করার জন্য অ্যারে।
    • খড়ের গালি - প্রয়োজনীয়, অ্যারে ব্যবহার করে সূঁচগুলি সরানোর জন্য।

    Criteria.repeat (অ্যারে)

    এটি দীর্ঘতম কলামের দৈর্ঘ্যের সাথে মেলে না হওয়া পর্যন্ত অ্যারেতে আইটেমগুলি পুনরাবৃত্তি করুন।

    • অ্যারে - প্রয়োজনীয়, পুনরাবৃত্তি করতে অ্যারে।

    Criteria.unique (সূঁচ)

    সূঁচ অ্যারে থেকে কেবল অনন্য মানগুলি দেয়।

    • সূঁচ - প্রয়োজনীয়, এমন একটি অ্যারে পাস করুন যা থেকে আপনি সমস্ত নকল মান মুছে ফেলতে চান।

    Data.countFilesDownloaded ()

    ডাউনলোড করা ফাইলের মোট সংখ্যা গণনা করুন।


    Data.log (বার্তা)

    স্ক্র্যাপ লগতে একটি বার্তা লিখে।

    • বার্তা - প্রয়োজনীয়, লগতে লিখতে বার্তা।

    ডেটা.প্যাড (প্যাডভ্যালু, ডেটাসেট)

    নির্দিষ্ট ডেটাসেটের সমস্ত কলামে একই সংখ্যক ঘর না হওয়া অবধি কলামের শেষে খালি ঘর যুক্ত করে ডেটাसेटে উপস্থিত সমস্ত কলামকে প্যাড করে।

    • প্যাডভ্যালু - ঐচ্ছিক, কক্ষগুলি প্যাড করার মান। যদি কোনওটি নির্দিষ্ট না করা হয় তবে একটি খালি মান ব্যবহৃত হয়।
    • ডেটাসেট - ঐচ্ছিক, প্যাডে ডেটাসেট।

    ডেটা.ড্রেডকলাম (ডেটাসেট, কলাম)

    নির্দিষ্ট ডেটাसेट থেকে নির্দিষ্ট কলামটি একটি কলাম পড়ে Read

    • ডেটাসেট - ঐচ্ছিক, মানটি পড়ার জন্য ডেটাসেট।
    • কলাম - ঐচ্ছিক, মানটি পড়ার জন্য ডেটাসেটে কলাম।

    ডেটা।save(মানs, ডেটাসেট, কলাম)

    Saveডেটাসেট এবং কলাম নির্দিষ্ট করে কোনও মান বা মান।

    • মান - প্রয়োজনীয়, আপনার মানগুলির যে কোনও মান বা অ্যারে পাস করুন save.
    • ডেটাসেট - ঐচ্ছিক, ডেটাসেট থেকে save মূল্য into.
    • কলাম - ঐচ্ছিক, ডেটাসেট থেকে কলাম save মূল্য into.

    ডেটা।saveDOCXScreenshot (htmlOrUrls, বিকল্পগুলি, ডেটাসেট, কলাম)

    এইচটিএমএল, ইউআরএল বা ইউআরএলগুলির একটি ডোকএক্স স্ক্রিনশট নিন এবং allyচ্ছিকভাবে ডেটাসেট এবং নির্দিষ্ট কলামে ফাইলটিতে একটি লিঙ্ক স্থাপন করুন।

    • ইউআরএল - প্রয়োজনীয়, আপনি যে কোনও ইউআরএল বা ডিওএক্সএক্স স্ক্রিনশট নিতে চান তার url বা অ্যারে পাস করুন।
    • বিকল্প - ঐচ্ছিক, স্ক্রিনশট বিকল্প।
    • ডেটাসেট - ঐচ্ছিক, ডেটাসেট থেকে save ডোকএক্স স্ক্রিনশট লিঙ্ক into.
    • কলাম - ঐচ্ছিক, ডেটাসেট থেকে কলাম save ডোকএক্স স্ক্রিনশট লিঙ্ক into.

    ডেটা।saveImageScreenshot (htmlOrUrls, বিকল্পগুলি, ডেটাসেট, কলাম)

    এইচটিএমএল, ইউআরএল বা ইউআরএলগুলির একটি চিত্রের স্ক্রিনশট নিন এবং allyচ্ছিকভাবে ডেটাসেট এবং নির্দিষ্ট কলামে ফাইলটিতে একটি লিঙ্ক স্থাপন করুন।

    • ইউআরএল - প্রয়োজনীয়, আপনার কোনও চিত্রের স্ক্রিনশট নিতে ইচ্ছুক কোনও ইউআরএল বা অ্যারে পাস করুন।
    • বিকল্প - ঐচ্ছিক, স্ক্রিনশট বিকল্প।
    • ডেটাসেট - ঐচ্ছিক, ডেটাসেট থেকে save ইমেজ স্ক্রিনশট লিঙ্ক into.
    • কলাম - ঐচ্ছিক, ডেটাসেট থেকে কলাম save ইমেজ স্ক্রিনশট লিঙ্ক into.

    ডেটা।savePDFScreenshot (htmlOrUrls, বিকল্পগুলি, ডেটাসেট, কলাম)

    এইচটিএমএল, ইউআরএল বা ইউআরএলগুলির একটি পিডিএফ স্ক্রিনশট নিন এবং allyচ্ছিকভাবে নির্দিষ্ট ডেটাসেট এবং কলামে ফাইলটিতে একটি লিঙ্ক রাখুন।

    • ইউআরএল - প্রয়োজনীয়, আপনি যে কোনও ইউআরএল এর পিডিএফ স্ক্রিনশট নিতে চান তা url বা অ্যারে পাস করুন।
    • বিকল্প - ঐচ্ছিক, স্ক্রিনশট বিকল্প।
    • ডেটাসেট - ঐচ্ছিক, ডেটাসেট থেকে save পিডিএফ স্ক্রিনশট লিঙ্ক into.
    • কলাম - ঐচ্ছিক, ডেটাসেট থেকে কলাম save পিডিএফ স্ক্রিনশট লিঙ্ক into.

    ডেটা।saveTableScreenshot (htmlOrUrls, বিকল্পগুলি, ডেটাসেট, কলাম)

    এইচটিএমএল, ইউআরএল বা ইউআরএলগুলির একটি টেবিলের স্ক্রিনশট নিন এবং নির্দিষ্টভাবে ডেটাসেট এবং কলামে ফাইলটিতে একটি লিঙ্ক স্থাপন করুন।

    • ইউআরএল - প্রয়োজনীয়, আপনি কোনও টেবিলের স্ক্রিনশট নিতে ইচ্ছুক url এর যে কোনও url বা অ্যারে পাস করুন।
    • বিকল্প - ঐচ্ছিক, স্ক্রিনশট বিকল্প।
    • ডেটাসেট - ঐচ্ছিক, ডেটাসেট থেকে save টেবিলের স্ক্রিনশট লিঙ্ক into.
    • কলাম - ঐচ্ছিক, ডেটাসেট থেকে কলাম save টেবিলের স্ক্রিনশট লিঙ্ক into.

    ডেটা।saveফাইল (URLs, ফাইলের নাম, ডেটাসেট, কলাম)

    Saveযে কোনও ইউআরএল বা ইউআরএল ফাইল হিসাবে এবং allyচ্ছিকভাবে নির্দিষ্ট ডেটাসেট এবং কলামে ফাইলটিতে একটি লিঙ্ক রাখে।

    • ইউআরএল - প্রয়োজনীয়, যে কোনও ইউআরএল বা URL ঘুরতে চান তা সরিয়ে দিন intoa ফাইল (গুলি)।
    • ফাইলের নাম - ঐচ্ছিক, উত্পাদিতটির পরিবর্তে আপনি যে ফাইল ফাইলটি ব্যবহার করতে চান তা পাস করুন।
    • ডেটাসেট - alচ্ছিক, ডেটাসেট থেকে save ফাইল লিঙ্ক into.
    • কলাম - ঐচ্ছিক, ডেটাসেট থেকে কলাম save ফাইল লিঙ্ক into.

    ডেটা।saveToFile (ডেটা, ফাইলের নাম, ডেটাসেট, কলাম)

    Saveযে কোনও ডেটা বা ডেটা আইটেম ফাইল হিসাবে এবং allyচ্ছিকভাবে ডেটাসেট এবং নির্দিষ্ট কলামে ফাইলটিতে একটি লিঙ্ক স্থাপন করে।

    • ডেটা - প্রয়োজনীয়, যে কোনও ডেটা বা ডেটা অ্যারে পাস করতে চান save একটি ফাইল (গুলি) এ।
    • ফাইলের নাম - ঐচ্ছিক, উত্পাদিতটির পরিবর্তে আপনি যে ফাইল ফাইলটি ব্যবহার করতে চান তা পাস করুন।
    • ডেটাসেট - alচ্ছিক, ডেটাসেট থেকে save ফাইল লিঙ্ক into.
    • কলাম - ঐচ্ছিক, ডেটাসেট থেকে কলাম save ফাইল লিঙ্ক into.

    ডেটা।saveএকটি স্বতন্ত্র (মানs, ডেটাসেট, কলাম)

    Saveডেটাসেট এবং কলাম নির্দিষ্ট করে দেওয়া কোনও অনন্য মান বা মান। একই ডেটাসেট এবং কলামে সদৃশ মানগুলি উপেক্ষা করা হবে।

    • মান - প্রয়োজনীয়, আপনার মানগুলির যে কোনও মান বা অ্যারে পাস করুন save.
    • ডেটাসেট - ঐচ্ছিক, ডেটাসেট থেকে save মূল্য into.
    • কলাম - ঐচ্ছিক, ডেটাসেট থেকে কলাম save মূল্য into.

    ডেটা।saveUniqueFile (URLs, ফাইলের নাম, ডেটাসেট, কলাম)

    Saveযে কোনও ইউআরএল বা ইউআরএল ফাইল হিসাবে এবং allyচ্ছিকভাবে নির্দিষ্ট ডেটাসেট এবং কলামে ফাইলটিতে একটি লিঙ্ক রাখে। এই পদ্ধতিটি কেবল হবে save ডেটাসেট এবং কলাম নির্দিষ্ট করে দেওয়া অনন্য মান, বা যদি কোনও ডেটাসেট এবং কলামের সম্পূর্ণ স্ক্র্যাপের জন্য অনন্য URL না থাকে।

    • ইউআরএল - প্রয়োজনীয়, যে কোনও ইউআরএল বা URL ঘুরতে চান তা সরিয়ে দিন intoa ফাইল (গুলি)।
    • ফাইলের নাম - ঐচ্ছিক, উত্পাদিতটির পরিবর্তে আপনি যে ফাইল ফাইলটি ব্যবহার করতে চান তা পাস করুন।
    • ডেটাসেট - ঐচ্ছিক, ডেটাসেট থেকে save ফাইল লিঙ্ক into.
    • কলাম - ঐচ্ছিক, ডেটাসেট থেকে কলাম save ফাইল লিঙ্ক into.

    ডেটা।saveVideoAnimation (videoUrls, বিকল্পগুলি, ডেটাসেট, কলাম)

    একটি অনলাইন ভিডিও বা ভিডিও রূপান্তর করুন into অ্যানিমেটেড জিআইএফ (গুলি), এবং বিকল্পভাবে নির্দিষ্ট করা ডেটাसेट এবং কলামে ফাইলটির একটি লিঙ্ক রাখে।

    • ভিডিওআরএল - প্রয়োজনীয়, কোনও রূপান্তর করতে চান এমন কোনও ইউআরএল বা ইউআরএলের অ্যারে পাস করুন into অ্যানিমেটেড জিআইএফ (গুলি)।
    • বিকল্প - ঐচ্ছিক, অ্যানিমেশন বিকল্প।
    • ডেটাসেট - ঐচ্ছিক, ডেটাসেট থেকে save অ্যানিমেশন লিঙ্ক into.
    • কলাম - ঐচ্ছিক, ডেটাসেট থেকে কলাম save অ্যানিমেশন লিঙ্ক into.

    Global.get (নাম)

    পায় a saved পরিবর্তনশীল মান value

    • নাম - আবশ্যক, ফেরতের জন্য চলকের নাম।

    গ্লোবাল.সেট (নাম, মান)s, অবিরত)

    Saveস্ক্র্যাপড পৃষ্ঠাগুলির মধ্যে কোনও মান বা মান।

    • নাম - প্রয়োজনীয়, পরিবর্তনশীলটির নাম save.
    • মান - প্রয়োজনীয়, ভেরিয়েবল মান save.
    • অবিচলিত - alচ্ছিক, সত্য হলে ভেরিয়েবলটি স্ক্র্যাপগুলির মধ্যে রাখা হবে।

    Navigation.addTemplate (URLs, টেমপ্লেট)

    URL বা URL গুলি নির্দিষ্ট টেম্পলেট সম্পর্কিত হিসাবে সংজ্ঞায়িত করুন to এটি স্ক্র্যাপ নির্দেশিকাগুলি কেবলমাত্র নির্দিষ্ট ইউআরএলে চালানোতে সীমাবদ্ধ রাখতে দেয়।

    • ইউআরএল - প্রয়োজনীয়, আপনার কোনও টেমপ্লেট সংজ্ঞায়িত করতে চান এমন কোনও ইউআরএল বা অ্যারের পাস করুন।
    • টেমপ্লেট - প্রয়োজনীয়।

    Navigation.clearCookies ()

    বর্তমান স্ক্র্যাপের জন্য সমস্ত কুকিজ অপসারণ করুন।


    নেভিগেশন.নভিগেট (ফিল্টার, টেম্পলেট)

    এক বা একাধিক এইচটিএমএল উপাদানগুলিতে ক্লিক করুন।

    • ফিল্টার - প্রয়োজনীয়, ফিল্টারটি কোন HTML উপাদান (গুলি) ক্লিক করতে হবে তা সনাক্ত করতে ব্যবহৃত হয়।
    • টেমপ্লেট - নির্বাচিত এইচটিএমএল উপাদানটিতে নেভিগেট করার সময় টেম্পলেটটি নির্ধারিত।

    Navigation.goTo (URL)

    অবিলম্বে নির্দিষ্ট URL- এ যান।

    • url - প্রয়োজনীয়, নেভিগেট করতে URL টি to

    Navigation.hover (ফিল্টার)

    এক বা একাধিক এইচটিএমএল এলিমেন্টের ওপরে।

    • ফিল্টার - আবশ্যক, ফিল্টারটি কোন এইচটিএমএল উপাদান (গুলি) উপর ঘোরাতে পারে তা সনাক্ত করতে ব্যবহৃত হয়।

    Navigation.isTemplate (টেমপ্লেট)

    বর্তমান পৃষ্ঠাটি নির্দিষ্ট টেম্পলেটটির সাথে সম্পর্কিত হলে সত্যটি প্রত্যাবর্তন করে।

    • টেমপ্লেট - প্রয়োজনীয়, টেমপ্লেটটি পৃষ্ঠাটির সাথে সম্পর্কিত কিনা তা পরীক্ষা করতে।

    নেভিগেশন.প্যাজিট করুন (ফিল্টার, সেকেন্ড)

    নির্দিষ্ট উপাদানগুলির মাধ্যমে প্যাগিনেট করে।

    • ফিল্টার - আবশ্যক, ফিল্টারটি এইচটিএমএল উপাদানগুলির (গুলি) কীভাবে প্যাগিনেট করতে হবে তা সনাক্ত করতে ব্যবহৃত হয়।
    • সেকেন্ড - প্রয়োজনীয়, পৃষ্ঠাবদ্ধ ফলাফলের মধ্যে যাওয়ার মধ্যে সেকেন্ডের সংখ্যা।

    Navigation.remove (ফিল্টার)

    এক বা একাধিক এইচটিএমএল উপাদান মুছুন।

    • ফিল্টার - প্রয়োজনীয়, কোন HTML উপাদান (গুলি) মুছতে হবে তা সনাক্ত করতে ফিল্টার ব্যবহৃত হয়।

    Navigation.scroll (ফিল্টার)

    একটি নির্বাচিত উপাদান বা পুরো ওয়েব পৃষ্ঠা স্ক্রোল করুন।

    • ফিল্টার - alচ্ছিক, ফিল্টারটি কোন উপাদানটি স্ক্রোল করতে হবে তা সনাক্ত করতে ব্যবহৃত হয়, যদি সরবরাহ না করা হয় তবে পুরো ওয়েব পৃষ্ঠাটি স্ক্রোল করা হবে।

    Navigation.select (মানs, ছাঁকনি)

    একটি নির্বাচন উপাদান একটি বা একাধিক বৈধ মান নির্বাচন করুন।

    • মান - প্রয়োজনীয়, একটি বা একাধিক মান নির্বাচন করতে।
    • ফিল্টার - প্রয়োজনীয়, ফিল্টারটি কোন উপাদান নির্বাচন করতে হবে তা সনাক্ত করতে ব্যবহৃত হয়।

    Navigation.stopScraping (পরিত্যাগ)

    তত্ক্ষণাত স্ক্র্যাপিং বন্ধ করুন।

    • বাতিল - alচ্ছিক, যদি সত্য হয় তবে আরও কোনও প্রক্রিয়াজাতকরণ বন্ধ করে দেয় এবং কোনও ফলাফল রফতানি বা প্রেরণ না করে।

    Navigation.type (পাঠ্যs, ছাঁকনি)

    টেক্সট লিখুন intOA উপাদান।

    • পাঠ্য - প্রয়োজনীয়, এক বা একাধিক পাঠ্যের আইটেম টাইপ করতে।
    • ফিল্টার - প্রয়োজনীয়, ফিল্টারটি কোন উপাদানটি টাইপ করতে হবে তা সনাক্ত করতে ব্যবহৃত হয় into.

    Navigation.wait (সেকেন্ড)

    চালিয়ে যাওয়ার আগে কয়েক সেকেন্ড অপেক্ষা করুন। এই ক্লিকটি ব্যবহার করার সময়, কমান্ডগুলি নির্বাচন করুন এবং টাইপ করার সময় এটি সবচেয়ে কার্যকর।

    • সেকেন্ড - প্রয়োজনীয়, অপেক্ষা করার জন্য সেকেন্ডের সংখ্যা।

    পেজ কন্টেন্টস (সন্ধান, বৈশিষ্ট্য, ফিল্টার)

    পৃষ্ঠাটিতে সন্ধানের জন্য পাঠ্য থাকলে তা সত্য হয়।

    • সন্ধান করুন - প্রয়োজনীয়, পাঠ্যটি সন্ধান করুন।
    • অ্যাট্রিবিউট - searchচ্ছিক, সন্ধানের বৈশিষ্ট্য।
    • ফিল্টার - alচ্ছিক, কোন উপাদানটি সন্ধান করতে হবে তা সনাক্ত করতে ব্যবহৃত ফিল্টার।

    Page.exists (ফিল্টার)

    পৃষ্ঠাটিতে এমন কোনও উপাদান রয়েছে যা অনুসন্ধান ফিল্টারটির সাথে মেলে যদি সত্য ফিরে আসে।

    • ফিল্টার - প্রয়োজনীয়, কোন উপাদানটি অনুসন্ধান করতে হবে তা সনাক্ত করতে ফিল্টার ব্যবহৃত হয়।

    Page.getAuthor ()

    একটি নির্দিষ্ট করা থাকলে পৃষ্ঠা লেখক পান।


    Page.getDescription ()

    একটি নির্দিষ্ট করা থাকলে পৃষ্ঠার বিবরণ পান।


    Page.getFavIconUrl ()

    পৃষ্ঠার ফ্যাভিকন ইউআরএল পায়।


    Page.getHtml ()

    কাঁচা পৃষ্ঠা এইচটিএমএল পায়।


    Page.getKeywords ()

    পৃষ্ঠার কীওয়ার্ডগুলি স্ক্র্যাপ করা হচ্ছে।


    Page.getLastModified ()

    ওয়েবপৃষ্ঠাটি পৃষ্ঠার মেটাডেটা বা প্রতিক্রিয়া শিরোনাম থেকে সর্বশেষ পরিবর্তন করার সময়টি পান।


    Page.getPageNumber ()

    স্ক্র্যাপ করা হচ্ছে এমন বর্তমান ইউআরএলটির পৃষ্ঠা নম্বর পায়।


    Page.getPreviousUrl (INDEX)

    পূর্ববর্তী ইউআরএল পাওয়া যায়, একটি -1 সর্বশেষ ইউআরএল নির্দেশ করে, যখন একটি নিম্ন সংখ্যাটি পূর্ববর্তী ইউআরএল নির্দেশ করে।

    • সূচক - alচ্ছিক, ফিরে আসার জন্য পূর্ববর্তী পৃষ্ঠার সূচক। -1 এ ডিফল্ট।

    Page.getTagAttribute (বৈশিষ্ট্য, ফিল্টার)

    মিলে যাওয়া বৈশিষ্ট্যটির মান প্রদান করে।

    • বৈশিষ্ট্য - প্রয়োজনীয়, অনুসন্ধানের জন্য বৈশিষ্ট্য।
    • ফিল্টার - alচ্ছিক, কোন উপাদানটি অনুসন্ধান করতে হবে তা সনাক্ত করতে ব্যবহৃত ফিল্টার।

    Page.getTagAttributes (গুণ, ফিল্টার, লিঙ্কযুক্ত)

    মিলে যাওয়া সিএসএসের মানগুলি প্রদান করে।

    • বৈশিষ্ট্য - প্রয়োজনীয়, অনুসন্ধানের জন্য সিএসএস অ্যাট্রিবিউট।
    • ফিল্টার - alচ্ছিক, কোন উপাদানটি অনুসন্ধান করতে হবে তা সনাক্ত করতে ব্যবহৃত ফিল্টার।
    • লিঙ্কডটো - alচ্ছিক, কলাম দ্বারা এটির সাথে লিঙ্ক করা উচিত, যাতে আপেক্ষিক মানগুলি একত্রে রাখা হয়।

    Page.getTagCSS এ্যাট্রিবিউট (বৈশিষ্ট্য, ফিল্টার)

    মিলে যাওয়া সিএসএস মান প্রদান করে।

    • বৈশিষ্ট্য - প্রয়োজনীয়, অনুসন্ধানের জন্য সিএসএস অ্যাট্রিবিউট।
    • ফিল্টার - alচ্ছিক, কোন উপাদানটি অনুসন্ধান করতে হবে তা সনাক্ত করতে ব্যবহৃত ফিল্টার।

    Page.getTagCSS এ্যাট্রিবিউটস (গুণ, ফিল্টার, লিঙ্কযুক্ত)

    মিলে যাওয়া বৈশিষ্ট্য মানগুলি প্রদান করে।

    • বৈশিষ্ট্য - প্রয়োজনীয়, অনুসন্ধানের জন্য বৈশিষ্ট্য।
    • ফিল্টার - alচ্ছিক, কোন উপাদানটি অনুসন্ধান করতে হবে তা সনাক্ত করতে ব্যবহৃত ফিল্টার।
    • লিঙ্কডটো - alচ্ছিক, কলাম দ্বারা এটির সাথে লিঙ্ক করা উচিত, যাতে আপেক্ষিক মানগুলি একত্রে রাখা হয়।

    Page.getTagValue (ফিল্টার)

    ম্যাচের উপাদানগুলির মানটি প্রদান করে।

    • ফিল্টার - alচ্ছিক, কোন উপাদান (গুলি) অনুসন্ধান করতে হবে তা সনাক্ত করতে ব্যবহৃত ফিল্টার।

    Page.getTagValues ​​(ফিল্টার, লিঙ্কযুক্ত)

    ম্যাচের উপাদানগুলির মানগুলি প্রদান করে।

    • ফিল্টার - alচ্ছিক, কোন উপাদান (গুলি) অনুসন্ধান করতে হবে তা সনাক্ত করতে ব্যবহৃত ফিল্টার।
    • লিঙ্কডটো - alচ্ছিক, কলাম দ্বারা এটির সাথে লিঙ্ক করা উচিত, যাতে আপেক্ষিক মানগুলি একত্রে রাখা হয়।

    Page.getText ()

    পৃষ্ঠাটি থেকে দৃশ্যমান পাঠ্য পায়।


    Page.getTitle ()

    পৃষ্ঠার শিরোনাম পায়।


    Page.getUrl ()

    পৃষ্ঠার ইউআরএল পায়।


    Page.getValueXPath (xPath)

    সরবরাহ করা XPATH এর সাথে মেলে এমন মানটি দেয়।

    • xpath - প্রয়োজনীয়, উপাদান মান বা বৈশিষ্ট্যটির সাথে ম্যাচ করার জন্য XPATH।

    Page.getValuesXPath (xPath)

    সরবরাহিত XPATH এর সাথে মেলে এমন মানগুলি প্রদান করে।

    • xpath - প্রয়োজনীয়, উপাদান মান বা বৈশিষ্ট্য মেলে XPATH।

    Page.valid ()

    বর্তমানে স্ক্র্যাপ করা URL টি যদি একটি বৈধ ওয়েব পৃষ্ঠা হয় তবে তা সত্য হয়।


    Utility.Array.clean (মানs)

    মান অ্যারে থেকে সমস্ত নন এবং শূন্য মানগুলি ফেরত দেয়।

    • মান - প্রয়োজনীয়, পরিষ্কার করতে মানগুলির কোনও অ্যারে পাস করুন।

    Utility.Array.contains (মানs)

    সুই খড়ের খালি অ্যারেতে থাকলে সত্যটি ফেরত দেয়।

    • সুই - প্রয়োজনীয়, সন্ধানের জন্য কোনও মান বা অ্যারে পাস করুন।
    • খড়ের খালি - প্রয়োজনীয়, সুই বা সূঁচগুলি অনুসন্ধান করার জন্য অ্যারে।

    ইউটিলিটি.আররে ডুবে (অ্যারেএক্সএনএমএমএক্স, অ্যারেএক্সএনএমএমএক্স)

    দুটি অ্যারে মার্জ করে intওয়ান একটি খালি বা নাল মানকে দ্বিতীয় অ্যারের থেকে মান দিয়ে প্রতিস্থাপন করবে। উভয় অ্যারে অবশ্যই সমান আকারের হবে।

    • অ্যারেএক্সএনএমএক্স - প্রয়োজনীয়, একত্রিত করতে মানগুলির অ্যারে পাস করুন।
    • অ্যারেএক্সএনএমএক্স - প্রয়োজনীয়, একত্রিত করতে মানগুলির অ্যারে পাস করুন।

    Utility.Array.unique (মানs)

    মান অ্যারে থেকে অনন্য মানগুলি প্রদান করে।

    • মান - প্রয়োজনীয়, অনন্য করতে মানগুলির কোনও অ্যারে পাস করুন।

    Utility.Text.extractAddress (পাঠ্য)

    নির্দিষ্ট পাঠ্য প্যারামিটারের মধ্যে প্রথম ইমেল ঠিকানাটি বের করে।

    • পাঠ্য - প্রয়োজনীয়, পাঠানো থেকে কোনও ইমেল ঠিকানা বের করতে।

    Utility.Text.extractAddresses (পাঠ্য)

    নির্দিষ্ট পাঠ্য প্যারামিটারের মধ্যে থেকে সমস্ত ইমেল ঠিকানা বের করে।

    • পাঠ্য - প্রয়োজনীয়, পাঠানো থেকে সমস্ত ইমেল ঠিকানা বের করতে।

    ইউটিলিটি.টেক্সট.অ্যাক্সট্র্যাক লোকেশন (পাঠ্য, ভাষা)

    নির্দিষ্ট পাঠ্য প্যারামিটারের মধ্যে থেকে স্বয়ংক্রিয়ভাবে প্রথম অবস্থানটি বের করে।

    • পাঠ্য - প্রয়োজনীয়, পাঠ থেকে অবস্থানটি বের করতে ract
    • ভাষা - alচ্ছিক, দুটি অক্ষরের ISO 639-1 ফর্ম্যাটে নিষ্কাশনের পাঠ্যের ভাষা। 'En' এ ডিফল্ট। পাঠ্য ভাষাটি স্বয়ংক্রিয়ভাবে সনাক্ত করার চেষ্টা করতে 'অটো' ব্যবহার করুন।

    ইউটিলিটি.টেক্সট.অ্যাক্সট্র্যাক লোকেশন (পাঠ্য, ভাষা)

    নির্দিষ্ট পাঠ্য প্যারামিটারের মধ্যে থেকে স্বয়ংক্রিয়ভাবে অবস্থানগুলি বের করে।

    • পাঠ্য - প্রয়োজনীয়, পাঠ্য থেকে স্থানগুলি বের করতে।
    • ভাষা - alচ্ছিক, দুটি অক্ষরের ISO 639-1 ফর্ম্যাটে নিষ্কাশনের পাঠ্যের ভাষা। 'En' এ ডিফল্ট। পাঠ্য ভাষাটি স্বয়ংক্রিয়ভাবে সনাক্ত করার চেষ্টা করতে 'অটো' ব্যবহার করুন।

    Utility.Text.extractLanguageName (পাঠ্য)

    পাঠ্য প্যারামিটারের মধ্যে থেকে বর্ণিত ভাষাটি স্বয়ংক্রিয়ভাবে বের করে।

    • পাঠ্য - প্রয়োজনীয়, পাঠ্যটি থেকে ভাষাটি বের করতে।

    Utility.Text.extractLanguageCode (পাঠ্য)

    পাঠ্য প্যারামিটারের মধ্যে থেকে বর্ণিত ভাষাটি স্বয়ংক্রিয়ভাবে বের করে।

    • পাঠ্য - প্রয়োজনীয়, পাঠ্যটি থেকে ভাষাটি বের করতে।

    ইউটিলিটি.টেক্সট.েক্সট্র্যাক্ট নাম (পাঠ্য, ভাষা)

    নির্দিষ্ট পাঠ্য প্যারামিটারের মধ্যে থেকে স্বয়ংক্রিয়ভাবে প্রথম নামটি বের করে।

    • পাঠ্য - প্রয়োজনীয়, পাঠ থেকে নামটি বের করতে text
    • ভাষা - alচ্ছিক, দুটি অক্ষরের ISO 639-1 ফর্ম্যাটে নিষ্কাশনের পাঠ্যের ভাষা। 'En' এ ডিফল্ট। পাঠ্য ভাষাটি স্বয়ংক্রিয়ভাবে সনাক্ত করার চেষ্টা করতে 'অটো' ব্যবহার করুন।

    ইউটিলিটি.টেক্সট.েক্সট্র্যাক্ট নাম (পাঠ্য, ভাষা)

    নির্দিষ্ট পাঠ্য প্যারামিটারের মধ্যে থেকে স্বয়ংক্রিয়ভাবে নামগুলি বের করে।

    • পাঠ্য - প্রয়োজনীয়, পাঠ থেকে নামটি বের করতে text
    • ভাষা - alচ্ছিক, দুটি অক্ষরের ISO 639-1 ফর্ম্যাটে নিষ্কাশনের পাঠ্যের ভাষা। 'En' এ ডিফল্ট। পাঠ্য ভাষাটি স্বয়ংক্রিয়ভাবে সনাক্ত করার চেষ্টা করতে 'অটো' ব্যবহার করুন।

    ইউটিলিটি.টেক্সট.অ্যাক্সট্রাক্ট অরগানাইজেশন (পাঠ্য, ভাষা)

    নির্দিষ্ট পাঠ্য প্যারামিটারের মধ্যে থেকে স্বয়ংক্রিয়ভাবে প্রথম সংস্থাটি বের করে।

    • পাঠ্য - প্রয়োজনীয়, পাঠ্যটি থেকে সংস্থাটি বের করতে।
    • ভাষা - alচ্ছিক, দুটি অক্ষরের ISO 639-1 ফর্ম্যাটে নিষ্কাশনের পাঠ্যের ভাষা। 'En' এ ডিফল্ট। পাঠ্য ভাষাটি স্বয়ংক্রিয়ভাবে সনাক্ত করার চেষ্টা করতে 'অটো' ব্যবহার করুন।

    ইউটিলিটি.টেক্সট.অ্যাক্সট্রাকআরগানাইজেশন (পাঠ্য, ভাষা)

    নির্দিষ্ট পাঠ্য প্যারামিটারের মধ্যে থেকে স্বয়ংক্রিয়ভাবে সংস্থাগুলি নিষ্কাশন করে।

    • সংস্থাগুলি থেকে এক্সট্রাক্ট করার জন্য পাঠ্য - প্রয়োজনীয়।
    • ভাষা - alচ্ছিক, দুটি অক্ষরের ISO 639-1 ফর্ম্যাটে নিষ্কাশনের পাঠ্যের ভাষা। 'En' এ ডিফল্ট। পাঠ্য ভাষাটি স্বয়ংক্রিয়ভাবে সনাক্ত করার চেষ্টা করতে 'অটো' ব্যবহার করুন।

    Utility.Text.extractSentiment (পাঠ্য)

    নির্দিষ্ট পাঠ্য প্যারামিটারের মধ্যে থেকে স্বয়ংক্রিয়ভাবে সংবেদনটি বের করে।

    • পাঠ্য - প্রয়োজনীয়, পাঠ্যটি থেকে সংবেদনটি বের করতে।

    Utility.Image.extractText (URLs, ভাষা)

    কোনও নির্দিষ্ট চিত্র থেকে টেক্সট নিষ্কাশন করতে অপটিকাল অক্ষর সনাক্তকরণ ব্যবহার করার চেষ্টা করা হয়।

    • ইউআরএল - প্রয়োজনীয়, যে কোনও চিত্র বা URL থেকে পাঠ্যটি উত্তোলন করতে চান এমন URL গুলির অ্যারেটি পাস করুন।
    • ভাষা - alচ্ছিক, দুটি অক্ষরের ISO 639-1 ফর্ম্যাটে নিষ্কাশনের পাঠ্যের ভাষা। 'En' এ ডিফল্ট।

    Utility.URL.addQueryStringপ্যারামিটার (URLs, প্রকৃত মূল্য)

    একটি কোয়েরি যুক্ত করুনstring যে কোনও ইউআরএল বা ইউআরএলগুলির প্যারামিটার।

    • ইউআরএল - প্রয়োজনীয়, যে কোনও ইউআরএল বা URL জিজ্ঞাসা করতে ইচ্ছুক URL এর অ্যারে পাস করুন string পরামিতি।
    • কী - আবশ্যক, যোগ করার জন্য প্যারামিটারের কী।
    • মান - প্রয়োজনীয়, যোগ করার জন্য প্যারামিটারের মান।

    Utility.URL.getQueryStringপ্যারামিটার (URLs, মূল)

    একটি ক্যোয়ারির মান পায়string যে কোনও URL বা URL থেকে প্যারামিটার।

    • ইউআরএল - প্রয়োজনীয়, আপনি কোয়েরিটি পড়তে চান এমন কোনও ইউআরএল বা অ্যারের পাস করুন passstring থেকে প্যারামিটার।
    • কী - আবশ্যক, পড়ার জন্য প্যারামিটারের কী।

    Utility.URL.removeQueryStringপ্যারামিটার (URLs, মূল)

    একটি জিজ্ঞাসা সরানstring যে কোনও URL বা URL থেকে প্যারামিটার।

    • ইউআরএল - প্রয়োজনীয়, যে কোনও ইউআরএল বা URL জিজ্ঞাসা মুছে ফেলতে চান এর অ্যারে পাস করুনstring থেকে প্যারামিটার।
    • কী - আবশ্যক, অপসারণের জন্য প্যারামিটারের কী।

    Utility.URL.exists (URLs)

    প্রতিটি ইউআরএল কল করে URL বা URL গুলি আসলে উপস্থিত কিনা তা পরীক্ষা করে দেখুন।

    • ইউআরএল - প্রয়োজনীয়, যে কোনও ইউআরএল বা ইউআরএল উপস্থিত রয়েছে তা পরীক্ষা করতে চান তা পাস করুন।