افتانا - آموزش داده‌های وب تاریک به هوش مصنوعی

دانشمندان هوش مصنوعی جدید را به طور انحصاری در وب تاریک آموزش می‌دهند.

دانشمندان هوش مصنوعی جدید را به طور انحصاری در وب تاریک آموزش می‌دهند.

به گزارش افتانا به نقل از فیوچریسم، مدل‌های زبان بزرگ (LLM) شرکت OpenAI بر روی مجموعه وسیعی از داده‌ها آموزش دیده‌اند و اطلاعات را از دورترین نقاط اینترنت استخراج می‌کنند، اما اگر قرار باشد چنین مدلی در وب تاریک به دنبال اطلاعات بگردد چه اتفاقی می‌افتد؟

تیمی از محققان کره جنوبی دقیقاً این کار را انجام دادند و یک مدل هوش مصنوعی به نام DarkBERT ایجاد کردند تا برخی از کلی‌ترین دامنه‌های موجود در اینترنت را فهرست کند.

این یک نگاه اجمالی جذاب به برخی از تاریک‌ترین نقاط وب جهانی است که مترادف با فعالیت‌های غیرقانونی و مخرب از اشتراک‌گذاری داده‌های درز گرفته تا فروش مواد مخدر شده است.

مثل یک کابوس به نظر می‌رسد، اما محققان می‌گویند DarkBERT جبنه استفاده مثبت دارد: تلاش برای روشن کردن راه‌های جدید مبارزه با جرایم سایبری، زمینه‌ای که استفاده روزافزونی از پردازش زبان طبیعی داشته است.

شاید تعجب آور نباشد که فهمیدن قسمت‌هایی از وب که توسط موتورهای جستجو مانند گوگل شاخص نمی‌شوند و اغلب فقط از طریق نرم‌افزار خاصی قابل دسترسی هستند، کار آسانی نبود.

همانطور که در مقاله‌ای با عنوان «DarkBERT: مدل زبانی برای سمت تاریک اینترنت» که هنوز مورد بررسی قرار نگرفته است، این تیم مدل خود را به شبکه Tor، سیستمی برای دسترسی به بخش‌هایی از وب تاریک متصل کرد. سپس شروع به کار کرد و یک پایگاه داده از داده‌های خامی که پیدا کرد، ایجاد کرد.

این تیم می‌گوید مدل زبانی بزرگ جدید آن‌ها نسبت به مدل‌هایی که برای انجام کارهای مشابه آموزش دیده‌اند، از جمله RoBERTa که محققان فیس‌بوک در سال 2019 آن را طراحی کرده بودند، مفیدتر بوده است.

این تیم پیشنهاد می‌کند که DarkBERT می‌تواند برای انواع وظایف مرتبط با امنیت سایبری، مانند شناسایی سایت‌هایی که باج‌افزار می‌فروشند یا داده‌های محرمانه را درز می‌کنند، استفاده شود. همچنین می‌توان از آن برای گشتن در تالارهای وب تاریک بی‌شماری که روزانه به‌روزرسانی می‌شوند استفاده کرد و آن‌ها را برای هرگونه تبادل اطلاعات غیرقانونی نظارت کرد.

منبع: Futurism