ওয়েব ক্যাপচার এবং রূপান্তর করার সরঞ্জামসমূহ

ইউআরএল এবং এইচটিএমএলকে ডোকএক্সে রূপান্তর করুনপাইথন এপিআই

এইচটিএমএল বা ওয়েবপৃষ্ঠাগুলি রূপান্তর করার ক্ষমতা যুক্ত করা into আপনার অ্যাপ্লিকেশনটিতে শব্দ দস্তাবেজগুলি কখনও সহজ ছিল না গ্র্যাবসআইটির পাইথন এপিআই। তবে আপনি শুরু করার আগে মনে রাখবেন যে ফোন করার পরে URLToDOCX, HTMLToDOCX or FileToDOCX পদ্ধতিগুলি Save or SaveTo বাস্তবে ডওএক্সএক্স তৈরি করতে অবশ্যই কল করতে হবে।

বেসিক বিকল্পসমূহ

ডোক্স হিসাবে ওয়েবপৃষ্ঠাগুলি ক্যাপচার পুরো ওয়েব পৃষ্ঠাতে রূপান্তরিত করে intওএ ওয়ার্ড ডকুমেন্ট যা অনেক পৃষ্ঠায় সমন্বিত থাকতে পারে। ওয়েব পৃষ্ঠায় রূপান্তর করতে কেবল একটি প্যারামিটার প্রয়োজন intওএ ওয়ার্ড ডকুমেন্ট বা এইচটিএমএলকে ডোক্সে রূপান্তর করুন যেমন নীচের উদাহরণগুলিতে দেখানো হয়েছে।

grabzIt.URLToDOCX("https://www.tesla.com")
# Then call the Save or SaveTo method
grabzIt.HTMLToDOCX("<html><body><h1>Hello World!</h1></body></html>")
# Then call the Save or SaveTo method
grabzIt.FileToDOCX("example.html")
# Then call the Save or SaveTo method

কাস্টম আইডেন্টিফায়ার

আপনি একটি কাস্টম সনাক্তকারী পাস করতে পারেন DOCX নীচে প্রদর্শিত পদ্ধতি হিসাবে, এই মানটি আপনার গ্র্যাবজিট পাইথন হ্যান্ডলারের কাছে ফিরে আসে। উদাহরণস্বরূপ, এই কাস্টম শনাক্তকারীটি একটি ডাটাবেস শনাক্তকারী হতে পারে, যা কোনও ডকক্স ডকুমেন্টকে একটি নির্দিষ্ট ডাটাবেস রেকর্ডের সাথে যুক্ত করতে দেয়।

from GrabzIt import GrabzItDOCXOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItDOCXOptions.GrabzItDOCXOptions()
options.customId = "123456"

grabzIt.URLToDOCX("https://www.tesla.com", options)
# Then call the Save method
grabzIt.Save("http://www.example.com/handler.py")
from GrabzIt import GrabzItDOCXOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItDOCXOptions.GrabzItDOCXOptions()
options.customId = "123456"

grabzIt.HTMLToDOCX("<html><body><h1>Hello World!</h1></body></html>", options)
# Then call the Save method
grabzIt.Save("http://www.example.com/handler.py")
from GrabzIt import GrabzItDOCXOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItDOCXOptions.GrabzItDOCXOptions()
options.customId = "123456"

grabzIt.FileToDOCX("example.html", options)
# Then call the Save method
grabzIt.Save("http://www.example.com/handler.py")

শিরোনাম এবং ফুটেজ

ওয়ার্ড ডকুমেন্টে শিরোনাম বা পাদলেখ যুক্ত করতে আপনি অনুরোধ করতে পারেন যে আপনি একটি বিশেষ প্রয়োগ করতে চান টেমপ্লেট DOCX তৈরি করা হচ্ছে। এই টেমপ্লেট হতে হবে saveডি অগ্রিম এবং কোনও বিশেষ ভেরিয়েবলের সাথে শিরোনাম এবং পাদচরণের বিষয়বস্তু নির্দিষ্ট করে দেবে। নীচের উদাহরণে কোডটিতে ব্যবহারকারীরা "আমার টেম্পলেট" নামে তৈরি একটি টেম্পলেট ব্যবহার করছেন।

from GrabzIt import GrabzItDOCXOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItDOCXOptions.GrabzItDOCXOptions()
options.templateId = "my template"

grabzIt.URLToDOCX("https://www.tesla.com", options)
# Then call the Save or SaveTo method
grabzIt.SaveTo("result.docx")
from GrabzIt import GrabzItDOCXOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItDOCXOptions.GrabzItDOCXOptions()
options.templateId = "my template"

grabzIt.HTMLToDOCX("<html><body><h1>Hello World!</h1></body></html>", options)
# Then call the Save or SaveTo method
grabzIt.SaveTo("result.docx")
from GrabzIt import GrabzItDOCXOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItDOCXOptions.GrabzItDOCXOptions()
options.templateId = "my template"

grabzIt.FileToDOCX("example.html", options)
# Then call the Save or SaveTo method
grabzIt.SaveTo("result.docx")

এইচটিএমএল উপাদানকে ডোক্সে রূপান্তর করুন

আপনি যদি কোনও এইচটিএমএল উপাদান যেমন একটি ডিভ বা স্প্যান হিসাবে সরাসরি রূপান্তর করতে চান intওআর ওয়ার্ড ডকুমেন্ট আপনি গ্র্যাবজিট এর পাইথন লাইব্রেরির সাথে করতে পারেন। আপনি অবশ্যই পাস করতে হবে সিএসএস নির্বাচক আপনি যে রূপান্তর করতে চান এইচটিএমএল উপাদানটি targetElement GrabzIt এর পদ্ধতিDOCXOptions বর্গ.

...
<span id="Article">
<p>This is the content I am interested in.</p>
<img src="myimage.jpg">
</span>
...

এই উদাহরণে, আমরা স্প্যানের সমস্ত আইটেম ক্যাপচার করতে ইচ্ছুক যার আইডি রয়েছে Articleসুতরাং, আমরা নীচে প্রদর্শিত হিসাবে গ্র্যাবজিট এপিআই এ এটি পাস করি।

from GrabzIt import GrabzItDOCXOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItDOCXOptions.GrabzItDOCXOptions()
options.targetElement = "#Article"

grabzIt.URLToDOCX("http://www.bbc.co.uk/news", options)
# Then call the Save or SaveTo method
grabzIt.SaveTo("result.docx")