Skip to content

A simple tool to extract captions from Apify HTML exports into clean CSV files. Client-side & secure.

License

Notifications You must be signed in to change notification settings

ahmadsalamifar/html-caption-extractor

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 

Repository files navigation

📋 HTML Caption Extractor

ابزار استخراج کپشن از فایل‌های HTML (مخصوص Apify)

English | فارسی

🇬🇧 English

I built this tool to make my life easier when working with scraped data from Apify (or any other web scraper). Usually, when you export data as HTML, you get a messy table. This tool takes that HTML file, finds the "caption" column automatically, and gives you a clean CSV file ready for use.

🚀 Features

Drag & Drop: Just drop your HTML file, and it does the rest.

Smart Detection: It automatically looks for columns named caption, text, or similar variations.

Privacy First: It runs 100% in your browser. No data is uploaded to any server.

Bilingual: Supports both English and Persian interfaces.

🛠️ How to use

Export your dataset from Apify (or similar tools) as HTML Table.

Open this tool in your browser.

Upload the HTML file.

Click Extract and then Download CSV.

🇮🇷 Persian (فارسی)

من این ابزار رو ساختم تا کارم با خروجی‌های سایت Apify راحت‌تر بشه. معمولاً وقتی اطلاعات رو به صورت جدول HTML دانلود می‌کنیم، استخراج متن‌ها از توش سخته. این برنامه فایل HTML رو می‌گیره، خودش ستون کپشن (Caption) رو پیدا می‌کنه و یه فایل اکسل (CSV) تمیز تحویل می‌ده.

🚀 ویژگی‌ها

ساده و سریع: فایل رو بکشید و رها کنید (Drag & Drop).

تشخیص هوشمند: خودش دنبال ستون‌هایی با اسم caption یا text می‌گرده.

کاملاً امن: همه کارها توی مرورگر خودتون انجام می‌شه و هیچ فایلی جایی آپلود نمی‌شه.

دو زبانه: هم منوی فارسی داره و هم انگلیسی.

🛠️ روش استفاده

۱. از سایت Apify (یا ابزارهای مشابه) خروجی HTML بگیرید. ۲. این برنامه رو باز کنید. ۳. فایل رو انتخاب کنید و دکمه استخراج رو بزنید. ۴. فایل CSV نهایی رو دانلود کنید.

About

A simple tool to extract captions from Apify HTML exports into clean CSV files. Client-side & secure.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages