سفارش تبلیغ
خرید بلیط هواپیما، خرید و رزرو اینترنتی ، چارتر، سامتیک
  شاید سخن حق  

خداوند به موسی علیه السلام وحی کرد که دو کفش وعصای آهنین برگیر و آنگاه در زمین سیاحت کن و آثار و عبرتها را بجوی تا آن جا که کفشها پاره و عصا شکسته شود . [ابن دینار]

تازه‌نوشته‌ها آخرین فعالیت‌ها مجموعه‌نوشته‌ها فرزندانم

[بیشتر]

[بیشتر]

[بیشتر]

[بیشتر]

در صفحه نخست می‌خوانید:   حاج آقاست - ترامپیده - ولادت انسان کامل - کارخانه فرفره - تازه شوندگی - تب ِ مجازی - اولین جلونشینی - 
نرم افزار استخراج اطلاعات از صفحات وب جمعه 92 آبان 24 - 5:46 عصر

برای من که زیاد پیش آمده است
برای دیگران نمی‌دانم
بارها شده در سایت‌ها
یا نرم‌افزارهای تحت وب
دنبال مقاله یا مطلبی می‌گردی
صدها صفحه مطلب ذخیره می‌کنی
اما هزاران تگ و فرمت و تصویر
پیرامون متن مورد نظرت را گرفته است
چه باید کرد؟!

معمولاً چند خط کد می‌نوشتم
اول و آخر مطلبی را که می‌خواستم برمی‌گزیدم
فرمتی که منحصر به فرد باشد
و تکراری
باقی کار را نرم‌افزار انجام می‌داد
بسیار ساده و سریع
تمام فایل‌ها را می‌گشود
دنبال فرمت‌های داده شده می‌گشت
آن‌ها را که می‌یافت
درون‌شان هر چه مطلب بود بیرون می‌کشید و جداگانه ذخیره می‌کرد
شاید هزاران صفحه مطلب را با این روش تا به حال استخراج کرده‌ام
هر بار به یک دلیلی
و به یک نیازی
اما این‌بار...

با خود گفتم چرا یک ابزار کوچک و ساده نباشد
این کار را برای همیشه به انجام رساند
چرا مجبور باشم برای هر کنکاشی
یک بار کد بنویسم؟!

این شد که نوشتم
نرم‌افزاری که در این نشانی قرار دارد (http://movashah.org/o/Extractor.zip)
فرمت اول را می‌دهید
فرمت آخر مطلب را هم
نشانی شاخه‌‌ای که فایل‌ها در آن قرار دارند
پسوند فایل‌های مورد نظر
تا از سایر فایل‌ها صرف‌نظر نماید
اگر مایل بودید صفحات مختلف به هم نچسبند
گزینه مربوطه را تیک بزنید و فعال کنید
که فایل‌های متعدد ساخته شود
در آخر هم...

سایت‌هایی که مقالات و اخبار ارائه می‌نمایند
مهم‌‌ترین هدف برای استفاده شخصی از این ابزار هستند
حتی وبلاگ‌ها و خصوصاً آرشیوهای وبلاگ
برای کاربردهای مفید البته.

توضیح1: اگر سیستم عامل شما امکان اجرای آن را نداشت
فایل
msvbvm60.dll را دانلود کنید و در کنار برنامه اجرایی قرار دهید
و یا بسته کمکی
vbrun60sp6.exe را دانلود و نصب فرمایید.

توضیح2: این نرم‌افزار به صورت خودکار با باز کردن نخستین فایل
کاراکترست آن را شناسایی کرده (utf-8 یا ascii یا unicode)
و فایل خروجی را متناسب با همان می‌سازد.


<< مطلب بعدی: اولین جلونشینی
نوشته شده توسط: سید مهدی موشَّح نظرات شما ^

فهرست کاملی از نوشته‌هایم در این وبلاگ، از روزی که پارسی‌بلاگ افتتاح شد تا همین امروز که به لطف پروردگارم، هنوز قادر به نوشتنم!
از فعالیت
به فرزند
در سفر
به فرزند
با نوشتن
به فرزند

پنج شنبه 96 آذر 23

امروز: 516  بازدید

دیروز: 1620  بازدید

آشنایی
نرم افزار استخراج اطلاعات از صفحات وب - شاید سخن حق
سید مهدی موشَّح
آینده را بسیار روشن می‌بینم. شور انقلابی عجیبی در جوانان این دوران احساس می‌کنم. دیدگاه‌های انتقادی نسل سوم را سازگار با تعالی مورد انتظار اسلام تصوّر می‌نمایم. به حضور خود در این عصر افتخار کرده و از این بابت به تمام گذشتگان خود فخر می‌فروشم!
فهرست

[خـانه]

 RSS     Atom 

[پیام‌رسان]

[شناسـنامه]

[سایت شخصی]

[نشانی الکترونیکی]

 

شناسنامه
نام: سید مهدی موشَّح
نام مستعار: موسوی
جنسیت: مرد
استان محل سکونت: قم
زبان: فارسی
سن: 37
تاریخ تولد: 14 بهمن 1358
تاریخ عضویت: 20/5/1383
وضعیت تاهل: طلاق
شغل: خانه‌دار
تحصیلات: کارشناسی ارشد
وزن: 116
قد: 181
سایت شخصی
آرشیو
کلیدواژه‌ها
کتابخانه احادیث شیعه
هوای امروز شهر قم
مختصات بازدیدکنندگان


طراح قالب
خودم
آری! طراح این قالب خودم هستم... زمانی که گرافیک و Html و جاوااسکریپت‌های پارسی‌بلاگ را می‌نوشتم، این قالب را طراحی کردم و پیش‌فرض تمام وبلاگ‌های پارسی‌بلاگ قرار دادم.
البته استفاده از تصویر سرستون‌های تخته‌جمشید و نمایی از مسجد امام اصفهان و مجسمه فردوسی در لوگو به سفارش مدیر بود.

در سال 1383

تعداد 1584984 بازدید