دنیاکی مختلف زبانوںمیں جیسے جیسے بلاگنگ ترقی کررہی ہے ویسے ویسے صرف بلاگز سرچ کرنے کے لیے بہترین سرچ ٹول بھی وجود میں آتے جارہے ہیں۔ گوکہ اردو بلاگنگ کی تاریخ اتنی پرانی نہیں ہے اور زیادہ تر بلاگرز نے دو یا تین سال پہلے ہی اردو میں بلاگنگ کرنی شروع کی ہے۔ کیونکہ اب بلاگرز کی ایک قابل ذکر تعداد موجود ہے جو مختلف بلاگنگ ویب سائٹ یا پھر اپنی ذاتی ویب سائٹ پر بلاگنگ کررہے ہیں جس سے ہر گزرنے والے دن کے ساتھ بلاگز کی تعداد میںاضافہ ہو رہا ہے ۔ ویسے تو روزانہ کی بنیاد پر بلاگز اردو ویب کے سیارہ یا اسطرح کے مختلف ٹولز سے پڑھنے میں آجاتے ہیں لیکن جب ایک طویل وقت گزرنے کے بعد کسی خاص موضوع پر بلاگرز کی رائے جاننے کی ضرورت پڑھتی ہے تو سرچ نہ صرف یہ کے دشوار ہوجاتی ہے بلکہ بعض اوقات نا ممکن بھی۔
پچھلے ایک ہفتے سے میں اسی سلسلے میں مختلف سائٹس اور سرچ ٹولز پر تحقیق میں لگا ہوا تھا جس سے میں نے کچھ ابتدائی نتائج اخذ کیے ہیں۔ مجھے یہ خیال بہتر لگا کے بلاگرز سے ہی اس سلسلے میں کچھ رائے لے لی جائے کہ موجود سرچ انجنز اور ٹیکنالوجیز میں انکا کیسا تجربہ ہے۔ اگر میرے اخذ کیے گئے ابتدائی نتائج ہی کم و بیش تمام لوگوں کے خیالات ہیں تو پھر اس سلسلے میں ایک مشترکہ کوشش شروع کی جاسکتی ہے اور اگر پہلے ہی اس سلسلے میں کہیں کوئی پیش رفت ہوچکی ہے تو اسکو مزید بہتر بنانے یا ایک مرکزی بلاگ سرچ قائم کرنے کے سلسے میں کچھ کام ہوسکتا ہے۔
میرا حالیہ مسئلہ یہ ہے کہ اگر مجھے کسی ٹاپک پر اردو بلاگز سرچ کرنے ہیں تو میرے پاس دو آپشنز ہوتے ہیں
۔ ہر بلاگر کی ویب سائٹ پر جا کر اس ٹاپک پر سرچ کیا جائے
۔ گوگل یا کسی دوسرے سرچ انجن پر اس ٹاپک کو اردو بلاگز کے ساتھ تنگ سرچ کی جائے۔
پہلا آپشن اس لحاظ سے قابل عمل نہیں کے اول تو تمام بلاگرز کی ویب سائٹس پر سرچ موجود نہیں۔ اگر کچھ ویب سائٹس پر موجود ہے تو وہ بھی الفاظ کی میچنگ تک محدود ہے۔ مثال کے طور پر “خواتین“ کے سرچ میں شاذو نادر ہی “خاتون“ کے نتائج سامنے آئیں۔
گوگل یا دوسرے سرچ انجنز پر نتائج بہت ہی لا تعلق قسم کے آتے ہیں اور سب سے زیادہ کوفت اس وقت ہوتی ہے جب اردو سرچ میں بھی فارسی اور عربی کی ویب سائٹس لسٹ کردی جاتی ہیں۔
اسکی ایک وجہ یہ بھی ہوسکتی ہے کے جو انڈیکسرز استعمال کیے جارہے ہیں وہ غالبا پوری طرح اردو کے لیے تیار نہیں ہیں۔ مثلا اگر “خواتین“ کو انڈیکس کیا جائے تو میرے حساب سے روٹ لفظ “خاتون“ بننا چاہیے ۔۔ یعنی “خواتین“ ، خاتون“ اور “خاتونوں“ تینوں کی انڈیکس خاتون ہی بنے گی۔ اسی طرح سرچ کرتے ہوئے یہ بات بھی سامنے آئی کے غیر متعلقہ الفاظ کی کانٹ چھانٹ کا بھی کوئی معقول نظام موجود نہیں۔۔ یعنی اگر آپ “مشرف حکومت کے کارنامے پانچ سال میں“ سرچ کریں تو اس میں سے “کے“ اور “میں“ کو حذف کردینا چاہیے تاکہ بقیہ الفاظ کے روٹ تلاش کرکے متعقلہ بلاگز کی رینکنگ کی جائے اور اسطرح نتائج کا جو صفحہ تیار ہوگا اس میں کم از کم دس نتائج ایسے ہونگے جو آپکے متعلقہ صفحات ہونگے۔
ہوسکتا ہے میری سمت اس وقت درست نہیں ہے اسی لیے میں نے یہ عرض کی ہے کہ یہ میری ابتدائی معروضات ہیں اور شاید کسی بلاگر کے علم میں ان مسائل کے حل کے ساتھ ایسے سرچ ٹول ہوں جو کہ بلاگز کو ایک واحد لوکیشن سے سرچ کرنے کی اہلیت رکھتے ہوں۔ تو پھر اس پر گفتگو کر کے کم از کم ایک اسٹینڈرڈ قائم کیا جاسکتا ہے جیسے آہستہ آہستہ تقریبا تمام بلاگز ایک کی بورڈ، فانٹ اور بلاگنگ سافٹ ویر پر متفق ہوتے جارہے ہیں اور ایک غیر اعلان شدہ اسٹینڈرڈ وجود میں آچکا ہے۔
اب بات آتی ہے حل کی تو جیسا کے میں نے ایک پچھلے بلاگ میں عرض کی تھی کے ابتدائی طور پر میں نے اپاچی لیوسین کے ساتھ کچھ تجربے کیے ہیں جس سے سادہ الفاظ کی انڈیکسنگ اور سرچ کے بہترین نتائج حاصل ہوتے ہیں۔ لیوسین استعمال کر کے سادہ الفاظ کی انڈیکسنگ تو آسان ہے ۔۔ مثلا جمع کے سادہ قاعدے کو توڑ کر روٹ لفظ نکالنا آسان ہے جیسے فقیروں سے “وں“ ہٹا کر اسے “فقیر“ کے طور پر انڈیکس کرسکتے ہیں لیکن غربا سے غریب نکالنے کیا کیا طریقہ ہوگا یا اردو میں کسی لفظ کو پرکھ کر اسکے جمع یا واحد ہونے کا کیسے طے کیا جائے گا اس پر بہت زیادہ مدد درکار ہے۔ دوسرا ٹول اپاچی نوچ ہے جو ویب کرالنگ کے کام آتا ہے ۔ اپاچی نوچ، لیوسین کو انڈیکسنگ اے پی آئی کے طور پر استعمال کرتا ہے اور پورے ویب کر کرال کرنے کی اہلیت رکھتا ہے لیکن اسکی کرالنگ کو محدود کرکے صرف اردو بلاگزتک جاسکتا ہے جسکا نقطئہ آغاز سیارہ کا آرایس ایس ریڈر صفحہ ہوسکتا ہے۔
لیوسین اور نوچ بنیادی طور پر جاوا ٹولز (اے پی آئیز) ہیں لیکن انکے دوسری کمپیوٹر زبانوں یا پلیٹ فارمز پر امپلیمینٹیشنز موجود ہیں۔ سرچ انجن اپنی نوعیت میں ایک کامپلیکس سافٹ ویر ہوتا ہے اور اسکے لیے میں ذاتی طور پر پی ایچ پی یا اے ایس پی جیسی ٹیکنالوجیز استعمال کرنے کے حق میں نہیں کیونکہ سرچ انجن کو اگر آپ ایک ویب ایپلیکیشن کے طور پر بھی کہیں انسٹال کرتے ہیں تو پھر بھی ایک خاص وقفے کے بعد آپ کو اس بات کی ضرورت ہوتی ہے کے اسکی انڈیکسز کو خود کار نظام کے تحت ریفریش کیا جائے اور سرور کا مکمل کنٹرول نہ ہونے کے سبسب ہر ٹیکنالوجی میں اسطرح کی ملٹی تھریڈڈ اپلیکیکشن کی تنصیب کوئی آسان کام نہیں۔
اپنی لوکل مشین پر میں قریبا ایک ہفتے مزید نوچ کو انڈیکسنگ کے لیے چھوڑ رہا ہوں اور جو بھی نتائج آتے ہیں وہ تمام بلاگرز کے ساتھ ضرور شیئر کیے جائیں گے۔
آخر میں معذرت کے بہت ساری اصطلاحات میں نے دانستہ طور پر اسی طرح رکھی ہیں جیسا کے وہ عمومی طور پر مستعمل ہیں اور سب سے اہم یہ کے دوسرے بلاگرز کی رائے اس سلسلے میں کیا ہے اور آیا ایسے کسی نظام (بلاگ سرچ) کی ضرورت ہے بھی یا نہیں ؟