سفر به گورستان وب
اينترنت در ايران
حميد ضيايي پرور ziaee@hamshahri.org
نه تنها در دنياي واقعي كه در دنياي مجازي نيز گورستان وجود دارد . گورستان وب جايي است كه در آن ميليونها وب سايت به خواب ابدي رفته و آرميده اند . با اين وجود تكنولوژي هاي دنياي مجازي قادرند در صورت لزوم با فوت و فن هايي اين وب هاي مرده را احضار كرده و بر صفحه اينترنت ظاهر نمايند .
طبق اعلام سايت نت كرفت در آدرس http://news.netcraft.com در آوريل 2009 دقيقا 231,510,169 وب سايت در جهان وجود داشته است كه البته از اين ميان حدود 70 ميليون وب سايت فعال بوده است و بقيه غير فعال بوده اند . وب سايتهاي غير فعال شناسايي شده توسط نت كرفت داراي دامنه و ميزبان بوده اند ولي محتوايي براي به روز رساني نداشته اند .
حجم واقعي اطلاعات اينترنت
براي اينكه تصويري از حجم واقعي اطلاعات در فضاي سايبر داشته باشيد بهتر است بدانيد سرويس هاي جست وجوگر اينترنتي تنها بخش كوچكي از محتواي اينترنتي را در خود جاي داده اند. به گفته اشميت مديرعامل گوگل،حجم واقعي اينترنت هم اكنون به ٥ ميليون ترابايت رسيده است. به گفته وي حجم اينترنت در حالي به اين ميزان رسيده كه گوگل كه هم اكنون به عنوان بهترين موتور جست وجوگر به شمار مي رود، تنها ١٧٠ ترابايت از اين مقدار را ايندكس كرده است يا به اصطلاح به آن دسترسي دارد. گوگل همين ١٧٠ ترابايت را طي مدت ٧ سال ايندكس كرده است و به گفته اشميت، اگر بخواهيد تمام ٥ ميليون ترابايت اطلاعات را در گوگل ايندكس كنيد، به زماني در حدود ٣٠٠ سال نياز داريد. هر ترابايت ١٠٢٤ گيگابايت است.
وب مرده
وب مرده يا cobweb site وبي است كه مدتها است به روز نشده است . برخي ديگر از مصاديق وب مرده را مي توان اينچنين فهرست كرد :
وب سايتهايي كه تنها با فناوري هاي دايل آپ باز مي شوند و در صورت استفاده از نسل دوم تكنولوژي هاي اتصال به اينترنت پر سرعت دچار مشكل خواهند شد مرده محسوب مي شوند .
وب سايتهايي كه داراي پيوند به وب سايتها يا وبلاگهاي مرده و غير فعال هستند .
وب سايتهايي كه آدرس دامنه اصلي آنها تغيير كرده و در موتورهاي جستجو شناخته نمي شوند .
سایتهای که شاید کاربران اندکی داشته باشند، اما به روز رسانی ندارند و تنها در شبکه اینترنت وجود دارند تا محصولات يك شرکت را معرفی نمایند.
وب سايت افرادي كه صاحبان آنها واقعا مرده اند و ديگر به ر روز رساني نمي شوند .
وب سايت هايي كه به دليل فراموش كردن يا سرقت شدن نام كاربري يا كلمه عبور آن ، امكان دستيابي توسط مدير آنها وجود ندارد .
فرومها يا تالارهاي گفتگويي كه سال ها است بحث و تبادل نظري در آنها صورت نمي گيرد .
صفحات وبي كه به هيچ سندي پيوند نداشته و مستند نيستند و توسط موتورهاي جستجو شناخته نمي شوند .
نسل اول وب به دليل آمدن نسل دوم وب از ديدگاه بسياري از ناظران اينترنت وب مرده محسوب مي شود .امروز سمبل نسل وب 2 وب سايتهايي شبيه يوتيوب ، فيس بوك ، توئيتر و ماي اسپيس هستند و تكنولوژي هايي مانند RSS ، پادكست ، وبلاگ و آژاكس هستند . در عوض وب مرده نسلي از وب است كه هنوز خاصيت بيل بوردي يا تابلو اعلانات يك طرفه خود را حفظ كرده و بر آن اصرار مي ورزد
به گزارش سايت CRN حدود دو سوم از وبلاگهايي كه توسط يك رصد كننده وب بررسي شده اند طي دو ماه اخير به روز رساني نشده اند بنابر اين اين دسته از وبلاگها را مي توان در زمره وبلاگهاي مرده تلقي كرد
گوگل نقشي دوگانه در احياي وب سايتهاي مرده ايفا مي كند . بخش عمده اي از وب سايتهايي كه گوگل در نتايج خود نشان مي دهد وب سايتهايي هستند كه گاهي از 5 سال پيش تا كنون به روز نشده و محتوايي ثابت داشته اند . با اين حال به عنوان وب سايتهاي پر محتوا به بازديدكنندگان معرفي شده اند .
ظاهر كردن وب مرده
هميشه وب سايتهاي مرده فاقد اهميت نيستند . بر عكس برخي اوقات حتي وب سايتهاي مرده نيز مي توانند اطلاعات ذي قيمتي به مخاطبان ارايه كنند . شايد به همين دليل گوگل و ديگر موتور هاي جستجو محتواي وب سايتهاي مرده را در سرورهاي خود ذخيره كرده و از آنها براي ارايه اطلاعات و راهنمايي به جستجو كنندگان استفاده مي كنند . نحوه ظهور وب سايتها مرده در گوگل بدين صورت است كه در صورت باز نشدن يك صفحه وب ، شما آن را از نسخه ذخيره شده در Cashe گوگل بازيابي خواهيد كرد .
گاهي به دلايل تاريخي ، فني يا حقوقي لازم است كه نسخه قديمي يك صفحه وب مورد بازديد قرار گيرد . ممكن است حتي مدير يا صاحب اصلي اين گونه وب سايتها نيز نسخه قديمي آن را نداشته باشند . در اين صورت هم مي توان از آرشيو جستجوگرها بهره برد
يكي از روش هاي معتبر ظاهر كردن وب مرده استفاده از تكنولوژي موسوم به Wayback Machine است . در وب سايت http://web.archive.org/collections/web.html شما مي توانيد آدرس اينترنتي يك وب سايت را درج كنيد . اين وب سايت صفحات كامل تمام وب سايتهاي دنيا را از سال 1996 تا كنون در خود ذخيره كرده است . بانك اطلاعاتي اين وب سايت داراي 100 ترابايت اطلاعات ( حدود 120 هزار گيگا بايت ) بوده و بيش از 10 ميليون صفحه وبي را در خود ذخيره كرده است . در هنگام جستجوي صفحات وب مرده ، در اين سايت مي توانيد هر تاريخي را از 1996 تا كنون انتخاب كرده و وب مرده مورد نظر را ظاهر نماييد
از سوي ديگر وب سايت http://www.archive.org به عنوان يك مرجع كامل از ذخيره سازي و طبقه بندي محتواي وب سايتها از سال 1996 چنين اقدامي را انجام مي دهد . اين وب سايت وابسته به آرشيو ملي اينترنت امريكا در سان فرانسيسكواست كه وظيفه آن ارايه خدمات آرشيوي به محققان ، مورخان و دانشگاهيان در زمينه موضوعات مختلف است. اين مركز حدود 2 پتابايت اطلاعات در خود ذخيره كرده و هر ماهه 20 ترابايت اطلاعات جديد به مخزن اطلاعاتي اش اضافه مي شود . اين آرشيو بر روي 86 سرور رايان هاي قرار داشته و از سيستم عامل لينوكس بهره مي گيرد . امكان جستجو در آن بر اساس آدرس وب سايت يا نام وب سايت وجود دارد
با اين حال اطلاعات وبي قبل از سال 1996 در هيچ آرشيوي نگهداري نمي شود و مي توان وب سايتهاي مربوط به فاصله سال هاي 1991 يعني تاريخ ابداع وب توسط تيم برنرزلي تا 1996 را حقيقتا وب مرده و فراموش شده تلقي كرد .
از وب نامرئي تا وب مرده
مفهوم وب نامرئي با وب مرده بسيار متفاوت است ممكن است يك وب سايت به دلايل مختلف قابل بازديد براي عموم نباشد . اين به معناي مرده بودن آن وب نيست . بلكه امكان دارد دسترسي به محتواي آن براي كاربران محدود شده باشد .
وب نامرئی بخشی از شبکه جهان گستر وب است که عمدتا شامل منابع اطلاعاتی غیرمتنی و پویاست که به هر دلیل به طور موقت یا دائم خارج از حوزه جستجو و بازیابی موتورهای کاوش قرار دارند و بازیابی اطلاعات موجود در آن از طریق استفاده مستقیم از این موتورها میسر نمی باشد. امکان بازیابی منابع پنهان در وب نامرئی یا برای موتورهای کاوش از نظر فنی میسر نیست و یا محدودیت های مالی مانع از نمایه سازی این منابع شده است. مثلا توان مالی و فناوری فعلی موتورهای جستجو هنوز به مراتب محدودتر از آن است که بتوانند به نمایه سازی تمام صفحات و لایه های موجود در وب سایت ها بپردازند، چرا که این کار فرایندی پر خرج بوده و مستلزم فراهم آوری امکانات سخت افزاری قابل توجهی است. اهمیت وب عمیق عمدتاً از آنجا ناشی می شود که از نظر حجم اطلاعات مخفی در آن، این بخش از قلمرو وب نامرئی بزرگترین قسمت آن را به خود اختصاص می دهد به طوری که حجم اطلاعات موجود در آن چندین برابر وب آشکار یا وب سطحی تخمین زده می شود دسترسی به بعضی از منابع اطلاعاتی مثل انواع نشریه های الکترونیکی و پایگاههای اطلاعاتی مبتنی بر وب ، مستلزم پرداخت حق اشتراک است . محدوديتهاي زباني و فرمتهاي مختلف نيز باعث پنهان ماندن بخش بزرگي از وب از دسترس جستجوگرها شده است .
وب مرده در ايران
بخش عمده اي از وب سايتهاي فارسي و به خصوص دولتي و عمومي در ايران از نظر فني مرده محسوب مي شود چرا كه به روز رساني آنها به طور منظم صورت نمي گيرد . بارها شده كه مراجعه كنندگان به وب سايتهاي دستگاه هاي دولتي اطلاعاتي دريافت كرده اندكه اساسا ماه ها و بلكه سال ها است قديمي و بلا استفاده شده اند محسوس ترين نوع اطلاعات مرده در اين وب سايتها ، اطلاعات تماس شامل آدرس ها ، تلفن ها و اسامي مديران و كارشناسان مي باشد . متاسفانه هيچ متولي مشخصي براي اصلاح اين روند در كشور وجود ندارد و از آن بد تر اينكه انگيزه اي نيز براي به روز رساني اين محتواهاي ديجيتال موجود نيست .
به گفته دكتر سعيد رضا عاملي استاد ارتباطات دانشگاه تهران ، اگر به فضاي مجازي برويم و تفكرمان همچنان آنالوگ باشد، مراجعهكنندهها را با وب يخ، مرده و سرد مواجه ميكنيم، وبي كه در آن فقط اطلاعات ميميرد. اصلا هواي فضاي وب، اطلاعات است و مرتب كار كردن و بهروزرساني محتوا در اين فضا اهميت دارد. RSS مرتبط با موضوع فضا نيز بايد خيلي فعال باشد كه بتواند اين فضا را پويا نگه دارد. به نظر ميرسد برخي مديران ما چون فضاي مجازي برايشان قابل لمس نيست نميتوانند با آن رابطه مناسبي برقرار كنند و در سياستگذاري هم به آن بيتوجه هستند.
باز انتشار این مقاله در خبرگزاری ایسنا
April 28, 2009 03:28 PM
|
TrackBack