پیوندهای مرتبط
شرکت ها و تشکل های منتخب
برند ریدیت در برابر آرشیو اینترنت؛ مسدودسازی تاریخی برای مقابله با غولهای هوش مصنوعی
شرکت برند ریدیت اعلام کرده است که به دلیل سوءاستفاده برخی شرکتهای هوش مصنوعی از دادههای موجود در ابزار «ماشین زمان» آرشیو اینترنت (Internet Archive)، دسترسی این پلتفرم به محتوای ریدیت محدود میشود. این اقدام با هدف حفاظت از حریم خصوصی کاربران و جلوگیری از استفاده غیرمجاز از دادهها انجام خواهد شد
در اقدامی بحثبرانگیز، برند ریدیت (Reddit) تصمیم گرفته است دسترسی آرشیو اینترنت (Internet Archive) به محتوای خود را بهشدت محدود کند. این تصمیم پس از آن اعلام شد که ریدیت متوجه شد شرکتهای فعال در حوزه هوش مصنوعی، دادههای این پلتفرم را از طریق «ماشین زمان» (Wayback Machine) خزش (crawl) کرده و برای آموزش مدلهای هوش مصنوعی مورد استفاده قرار دادهاند.
از این پس، ماشین زمان قادر به ایندکس یا آرشیو کردن جزئیات پستها، بخش نظرات و پروفایلهای کاربران نخواهد بود. تنها امکان باقیمانده برای این ابزار، ایندکس کردن صفحه اصلی Reddit.com است. به این ترتیب، دسترسی عمومی تنها به تصویری کلی از محبوبترین تیترها و پستهای هر روز محدود خواهد شد و عمق محتوایی که پیشتر در آرشیو ثبت میشد، دیگر قابل ذخیرهسازی نیست.
تیم روابط عمومی برند ریدیت به نقل از «تیم راتشمیت» (Tim Rathschmidt) اعلام کرد: «آرشیو اینترنت خدمات ارزشمندی برای وب باز ارائه میدهد، اما ما مواردی از نقض سیاستهای پلتفرمها، از جمله سیاستهای خودمان، را شناسایی کردهایم که شامل خراشیدن دادهها از ماشین زمان است. تا زمانی که آرشیو اینترنت نتواند امنیت محتوای خود را تضمین و سیاستهای پلتفرمها را رعایت کند — از جمله حذف محتوای حذفشده و حفاظت از حریم خصوصی کاربران — دسترسی آنها به دادههای ریدیت محدود خواهد ماند.»
به گفته راتشمیت، این محدودیتها از امروز بهتدریج اعمال میشود و پیش از اجرای رسمی، آرشیو اینترنت از این تصمیم مطلع شده است. ریدیت در گذشته نیز نگرانیهایی درباره توانایی افراد برای خراشیدن محتوای موجود در آرشیو اینترنت مطرح کرده بود.
سیاستهای محدودکننده دسترسی به دادهها در برند ریدیت سابقه دارد. با افزایش تقاضا برای دادههای متنی توسط شرکتهای هوش مصنوعی، این پلتفرم بارها دسترسی به ابزارها و منابع عمومی را قطع کرده و تنها در صورت پرداخت هزینه اجازه استفاده از دادههایش را داده است. بهعنوان مثال، سال گذشته ریدیت قراردادی با گوگل امضا کرد که شامل استفاده از دادهها برای جستوجو و آموزش هوش مصنوعی بود. چند ماه بعد، این پلتفرم موتورهای جستوجوی بزرگ را از خزش دادههای خود محروم کرد مگر اینکه مبلغی پرداخت کنند.
علاوه بر این، تغییرات بحثبرانگیز در APIهای ریدیت در سال ۲۰۲۳ که به تعطیلی تعدادی از اپلیکیشنهای شخص ثالث انجامید و اعتراضات گستردهای را برانگیخت، از سوی این شرکت با سوءاستفاده برای آموزش مدلهای هوش مصنوعی توجیه شد. ریدیت همچنین توافقی با شرکت OpenAI داشت، اما در ژوئن گذشته از Anthropic شکایت کرد و مدعی شد که این شرکت همچنان به خراشیدن دادهها ادامه داده است؛ حتی پس از آنکه اعلام کرده بود این کار را متوقف کرده است.
با وجود این کشمکشها، «مارک گراهام»، مدیر ماشین زمان در بیانیهای گفت: «ما رابطهای طولانیمدت با ریدیت داریم و گفتوگوها درباره این موضوع ادامه دارد.» این اظهارنظر نشان میدهد که دو طرف همچنان در حال بررسی راهحلهایی برای ادامه همکاری هستند.
این تصمیم برند ریدیت بار دیگر مناقشه میان حفظ تاریخچه اینترنت و حفاظت از دادههای پلتفرمهای اجتماعی را برجسته کرده است. از یک سو، پروژههایی مانند آرشیو اینترنت برای حفظ میراث دیجیتال و دسترسی آزاد به اطلاعات حیاتی محسوب میشوند؛ از سوی دیگر، نگرانیهای مربوط به حریم خصوصی کاربران، مالکیت دادهها و سوءاستفاده بالقوه از آنها توسط فناوریهای نوظهور هوش مصنوعی نیز قابل انکار نیست.
به نظر میرسد آینده این رابطه به توانایی دو طرف در یافتن راهکاری وابسته باشد که هم احترام به حقوق مالکیت داده را تضمین کند و هم مأموریت آرشیو اینترنت در حفظ تاریخچه وب را تضعیف نکند.
منبع: ورج
در همین باره
پیشنهادها
خوانده شده ها
آخرین خبرها
مطالب مرتبط
تبلیغات