پیوند‌های مرتبط

شرکت ها و تشکل های منتخب

۲۱ مرداد ۱۴۰۴ | دیدگاه‌ها بسته هستند | تازه های برند

برند ریدیت در برابر آرشیو اینترنت؛ مسدودسازی تاریخی برای مقابله با غول‌های هوش مصنوعی

شرکت برند ریدیت اعلام کرده است که به دلیل سوءاستفاده برخی شرکت‌های هوش مصنوعی از داده‌های موجود در ابزار «ماشین زمان» آرشیو اینترنت (Internet Archive)، دسترسی این پلتفرم به محتوای ریدیت محدود می‌شود. این اقدام با هدف حفاظت از حریم خصوصی کاربران و جلوگیری از استفاده غیرمجاز از داده‌ها انجام خواهد شد

در اقدامی بحث‌برانگیز، برند ریدیت (Reddit) تصمیم گرفته است دسترسی آرشیو اینترنت (Internet Archive) به محتوای خود را به‌شدت محدود کند. این تصمیم پس از آن اعلام شد که ریدیت متوجه شد شرکت‌های فعال در حوزه هوش مصنوعی، داده‌های این پلتفرم را از طریق «ماشین زمان» (Wayback Machine) خزش (crawl) کرده و برای آموزش مدل‌های هوش مصنوعی مورد استفاده قرار داده‌اند.

از این پس، ماشین زمان قادر به ایندکس یا آرشیو کردن جزئیات پست‌ها، بخش نظرات و پروفایل‌های کاربران نخواهد بود. تنها امکان باقی‌مانده برای این ابزار، ایندکس کردن صفحه اصلی Reddit.com است. به این ترتیب، دسترسی عمومی تنها به تصویری کلی از محبوب‌ترین تیترها و پست‌های هر روز محدود خواهد شد و عمق محتوایی که پیش‌تر در آرشیو ثبت می‌شد، دیگر قابل ذخیره‌سازی نیست.

تیم روابط عمومی برند ریدیت به نقل از «تیم راتشمیت» (Tim Rathschmidt) اعلام کرد: «آرشیو اینترنت خدمات ارزشمندی برای وب باز ارائه می‌دهد، اما ما مواردی از نقض سیاست‌های پلتفرم‌ها، از جمله سیاست‌های خودمان، را شناسایی کرده‌ایم که شامل خراشیدن داده‌ها از ماشین زمان است. تا زمانی که آرشیو اینترنت نتواند امنیت محتوای خود را تضمین و سیاست‌های پلتفرم‌ها را رعایت کند — از جمله حذف محتوای حذف‌شده و حفاظت از حریم خصوصی کاربران — دسترسی آن‌ها به داده‌های ریدیت محدود خواهد ماند.»

به گفته راتشمیت، این محدودیت‌ها از امروز به‌تدریج اعمال می‌شود و پیش از اجرای رسمی، آرشیو اینترنت از این تصمیم مطلع شده است. ریدیت در گذشته نیز نگرانی‌هایی درباره توانایی افراد برای خراشیدن محتوای موجود در آرشیو اینترنت مطرح کرده بود.

سیاست‌های محدودکننده دسترسی به داده‌ها در برند ریدیت سابقه دارد. با افزایش تقاضا برای داده‌های متنی توسط شرکت‌های هوش مصنوعی، این پلتفرم بارها دسترسی به ابزارها و منابع عمومی را قطع کرده و تنها در صورت پرداخت هزینه اجازه استفاده از داده‌هایش را داده است. به‌عنوان مثال، سال گذشته ریدیت قراردادی با گوگل امضا کرد که شامل استفاده از داده‌ها برای جست‌وجو و آموزش هوش مصنوعی بود. چند ماه بعد، این پلتفرم موتورهای جست‌وجوی بزرگ را از خزش داده‌های خود محروم کرد مگر اینکه مبلغی پرداخت کنند.

علاوه بر این، تغییرات بحث‌برانگیز در APIهای ریدیت در سال ۲۰۲۳ که به تعطیلی تعدادی از اپلیکیشن‌های شخص ثالث انجامید و اعتراضات گسترده‌ای را برانگیخت، از سوی این شرکت با سوءاستفاده برای آموزش مدل‌های هوش مصنوعی توجیه شد. ریدیت همچنین توافقی با شرکت OpenAI داشت، اما در ژوئن گذشته از Anthropic شکایت کرد و مدعی شد که این شرکت همچنان به خراشیدن داده‌ها ادامه داده است؛ حتی پس از آنکه اعلام کرده بود این کار را متوقف کرده است.

با وجود این کشمکش‌ها، «مارک گراهام»، مدیر ماشین زمان در بیانیه‌ای گفت: «ما رابطه‌ای طولانی‌مدت با ریدیت داریم و گفت‌وگوها درباره این موضوع ادامه دارد.» این اظهارنظر نشان می‌دهد که دو طرف همچنان در حال بررسی راه‌حل‌هایی برای ادامه همکاری هستند.

این تصمیم برند ریدیت بار دیگر مناقشه میان حفظ تاریخچه اینترنت و حفاظت از داده‌های پلتفرم‌های اجتماعی را برجسته کرده است. از یک سو، پروژه‌هایی مانند آرشیو اینترنت برای حفظ میراث دیجیتال و دسترسی آزاد به اطلاعات حیاتی محسوب می‌شوند؛ از سوی دیگر، نگرانی‌های مربوط به حریم خصوصی کاربران، مالکیت داده‌ها و سوءاستفاده بالقوه از آن‌ها توسط فناوری‌های نوظهور هوش مصنوعی نیز قابل انکار نیست.

به نظر می‌رسد آینده این رابطه به توانایی دو طرف در یافتن راهکاری وابسته باشد که هم احترام به حقوق مالکیت داده را تضمین کند و هم مأموریت آرشیو اینترنت در حفظ تاریخچه وب را تضعیف نکند.

منبع: ورج