مقالات ترجمه شده

چگونه با هوش مصنوعی، تحقیقات اوسینت را بهبود دهیم


نویسنده: Nihad Hassan

۲۵ فوریه ۲۰۲۵

مقدمه

امروزه ابزارهای دیجیتال نقش اساسی در زندگی روزمره دارند؛ از عملیات تجاری و ارتباطات گرفته تا اشتراک‌گذاری اطلاعات. همین اتکا گسترده به ابزارهای دیجیتال باعث تولید حجم عظیمی از داده‌های قابل‌دسترسی عمومی شده است.

هر سال، جهان حدود ۱۲۰ زتابایت داده تولید می‌کند — یعنی بیش از ۲۵ تریلیون دی‌وی‌دی! این داده‌ها منبع ارزشمندی برای کسب‌وکارها و نهادهای دولتی هستند. برای نمونه، محتواهای کاربران در شبکه‌های اجتماعی برای تحلیل احساسات عمومی یا رفتار مصرف‌کننده مورد استفاده قرار می‌گیرند.

اوسینت چیست؟

اوسینت به فرایند گردآوری و تحلیل داده‌های در دسترس عموم، به‌منظور استخراج اطلاعات کاربردی و قابل اقدام گفته می‌شود. منابع آن عبارتند از:

  • منابع اینترنتی: پست‌های شبکه‌های اجتماعی، ویدیوها، فروم‌ها، بلاگ‌ها، بانک‌های اطلاعاتی عمومی.
  • رسانه‌های سنتی: روزنامه‌ها، مجلات، رادیو، تلویزیون.
  • ادبیات خاکستری: کتاب‌ها، مقالات علمی، پایان‌نامه‌ها.
  • اسناد تجاری: ثبت شرکت‌ها، کاتالوگ‌ها، پتنت‌ها.

چه کسانی از اوسینت بهره می‌برند؟

دولت‌ها: برای ارزیابی احساسات عمومی، پیش‌بینی بحران‌ها و پیگیری تهدیدات.

نهادهای اطلاعاتی: برای کشف حملات سایبری، شناسایی بازیگران تهدید و مقابله با تروریسم.

بانک‌ها و نهادهای مالی: برای بررسی مشتریان و تطبیق با مقررات.

کسب‌وکارها: برای تحلیل رقبا، رفتار مصرف‌کننده و طراحی استراتژی بازار.

رسانه‌ها و فعالان حقوق بشر: برای راستی‌آزمایی، افشای حقایق و پیگیری تخلفات.

وکلای حقوقی و محققان خصوصی: برای بررسی پرونده‌ها و جمع‌آوری شواهد.

تحلیلگران تهدیدات سایبری و تست نفوذ: برای جمع‌آوری اطلاعات هدف.

استفاده از هوش مصنوعی در اوسینت

با افزایش داده‌های عمومی، استفاده از ابزارهای مبتنی بر AI برای افزایش سرعت و دقت در مراحل مختلف تحقیقات اوسینت ضروری شده است:

۱. خودکارسازی گردآوری داده

  • ابزارهای AI در استخراج اطلاعات از فرمت‌های مختلف مانند PDF، تصاویر، ویدیو، فایل‌های متنی و اکسل بسیار مؤثرتر از اسکریپرهای سنتی هستند.
  • این ابزارها می‌توانند داده‌های مفید را از وب‌سایت‌ها، شبکه‌های اجتماعی، آرشیوها و دیتابیس‌ها جمع‌آوری کنند.

نمونه ابزارها:

  • AnyPicker : یک ابزار استخراج داده (Web Scraping) مبتنی بر هوش مصنوعی است که به کاربران اجازه می‌دهد بدون نیاز به کدنویسی، داده‌ها را از وب‌سایت‌ها استخراج کنند. این ابزار با کمک رابط کاربری گرافیکی (GUI) کاربرپسند خود و الگوریتم‌های یادگیری ماشین، می‌تواند به‌صورت خودکار الگوهای داده را در صفحات وب تشخیص دهد و اطلاعات مورد نظر را استخراج کند.
  • Browse AI : یک پلتفرم استخراج و پایش داده از وب مبتنی بر هوش مصنوعی است که بدون نیاز به کدنویسی به شما اجازه می‌دهد تنها با انتخاب نقاط مورد نظر، «ربات‌هایی» بسازید که سایتی را پیمایش، داده‌ها را استخراج و تغییرات را رصد کنند. این ربات‌ها به‌صورت خودکار صفحات را اسکرول می‌کنند، کپچا را مدیریت می‌کنند و اگر ساختار سایت تغییر کند، خود را تطبیق می‌دهند. خروجی‌ها را می‌توان به Google Sheets، CSV، JSON یا بیش از ۷۰۰۰ اپلیکیشن دیگر متصل کرد، و برای کارهای دوره‌ای نیز امکان زمان‌بندی وجود دارد.
  • ParseHub : یک ابزار پیشرفته وب‌اسکریپینگ مبتنی بر هوش مصنوعی است که با رابط کاربری گرافیکی و بدون نیاز به کدنویسی، به شما امکان می‌دهد اطلاعات را از وب‌سایت‌های پیچیده و پویا (مثل آن‌هایی که با JavaScript یا AJAX ساخته شده‌اند) استخراج کنید. این ابزار قابلیت‌هایی مانند گردش در صفحات متعدد، اسکرول بی‌نهایت، چرخش خودکار IP و زمان‌بندی خودکار استخراج را دارد و خروجی‌ها را در فرمت‌هایی مانند CSV، JSON یا مستقیماً به Google Sheets منتقل می‌کند.

۲. تحلیل مجموعه‌داده‌های بزرگ

  • ابزارهای AI قادر به فیلتر و دسته‌بندی داده‌ها بر اساس کلمات کلیدی، احساسات، یا موجودیت‌های خاص هستند.
  • در تحلیل سیاسی یا امنیتی، می‌توانند پست‌هایی با مضمون «اعتراض»، «تحریم»، یا «اعتصاب» را یافته و اولویت‌گذاری کنند.
  • در فضای دارک‌وب، می‌توانند به جستجوی واژه‌هایی چون ransomware یا stolen credentials بپردازند.

نمونه ابزارها:

Ovis (تحلیل تصویر و ویدیو) : ابزار Ovis یک مدل هوش مصنوعی چندرسانه‌ای (Multimodal AI) منبع‌باز است که توسط تیم  AIDC-AI (وابسته به علی‌بابا) توسعه داده شده و برای تحلیل، تولید و ویرایش تصویر با متن طراحی شده است. جدیدترین نسخه‌ی آن، Ovis-U1، یک مدل قدرتمند است که می‌تواند هم تصویر را بفهمد، هم بر اساس دستور متنی تصویر بسازد یا آن را ویرایش کند.

Lenso.ai (جستجوی تصویر) : یک موتور جستجوی معکوس تصویر مبتنی بر هوش مصنوعی محصول یک شرکت لهستانی (تأسیس ۲۰۲۴ در وراچواف) است که به شما این امکان را می‌دهد تا فقط با آپلود یک عکس، افراد، مکان‌ها، تصاویر مشابه یا نسخه‌های تکراری آن را پیدا کنید.

Dataminr (تشخیص تهدید) : یک پلتفرم پیشرفته‌ی هشداردهی و تحلیل بلادرنگ است که با استفاده از هوش مصنوعی، اطلاعات حساس و فوری را از میلیون‌ها منبع عمومی (از جمله شبکه‌های اجتماعی، وب‌سایت‌ها، خبرگزاری‌ها، داده‌های حسگر و موارد دیگر) استخراج می‌کند. این ابزار به دولت‌ها، شرکت‌ها، سازمان‌های خبری و امدادرسانی کمک می‌کند تا اتفاقات مهم را زودتر از منابع رسمی تشخیص دهند و سریع واکنش نشان دهند.

Paliscope (پلتفرم جامع اوسینت) : مجموعه‌ای از ابزارهای پیشرفته OSINT و تحلیل داده‌های دیجیتال برای محققان، روزنامه‌نگاران، نیروهای امنیتی و سازمان‌های اطلاعاتی است، طراحی‌شده تا داده‌های متنی، تصویری، صوتی و ویدئویی را با استفاده از هوش مصنوعی به‌صورت درمحل (on-premise)  و آفلاین تحلیل کند.

۳. خلاصه‌سازی داده‌ها

  • ابزارهای پردازش زبان طبیعی NLP (می‌تواند اسناد و پست‌های طولانی را خلاصه کند.)
  • مثلاً در بررسی‌های مالی، می‌توانند گزارش‌های پیچیده را خلاصه کرده و ناهنجاری‌ها را برجسته کنند.
  • همچنین، می‌توانند افراد، مکان‌ها، سازمان‌ها و زمان‌ها را از متون استخراج کنند.

۴. تحلیل پیش‌بینی‌محور (Predictive Analytics)

  • AI می‌تواند روندهای آینده را پیش‌بینی کرده و هشدارهای زودهنگام ارائه دهد. مثال: پیش‌بینی بحران‌های سیاسی یا اقتصادی با تحلیل افزایش گفتگو درباره تورم، بیکاری، یا قطع زنجیره تأمین.
  • همچنین می‌تواند احساسات عمومی درباره‌ی یک انتخابات یا سیاست را با تحلیل میلیون‌ها پست شبکه‌های اجتماعی ارزیابی کند.

ابزارهای تحلیل احساسات:

Free Sentiment Analyzer : ابزاری آنلاین برای تحلیل احساسات متون است که با استفاده از الگوریتم‌های پردازش (زبان طبیعیNLP) به شما کمک می‌کند تا بفهمید متن وارد شده مثبت، منفی یا خنثی است. این ابزار معمولاً برای تحلیل نظرات کاربران، بازخوردها، شبکه‌های اجتماعی و داده‌های متنی استفاده می‌شود و به سرعت نتایج را نمایش می‌دهد.

FaceReader  (تحلیل چهره) : نرم‌افزاری پیشرفته برای تحلیل خودکار حالات صورت و شناسایی احساسات انسانی است که توسط شرکت Noldus توسعه یافته است. این ابزار با استفاده از الگوریتم‌های بینایی ماشین و یادگیری عمیق، قادر به شناسایی و طبقه‌بندی دقیق حالات صورت در ویدئوها و تصاویر ثابت است.

Social Media Sentiment Visualization : به مجموعه ابزارها و تکنیک‌هایی گفته می‌شود که داده‌های احساسی (Sentiment) استخراج شده از شبکه‌های اجتماعی را به صورت گرافیکی و بصری نمایش می‌دهند. هدف این نوع ویژوالیزیشن، کمک به درک بهتر روندها، احساسات عمومی و واکنش‌ها نسبت به موضوعات خاص در پلتفرم‌هایی مانند توییتر، اینستاگرام، فیسبوک و غیره است.

جمع‌بندی

AI ستون فقرات آینده اوسینت است. بدون آن، تحلیل حجم انبوه داده‌ها نه‌تنها زمان‌بر بلکه پرخطا خواهد بود.

تحقیقات اوسینت با AI سریع‌تر، دقیق‌تر و قابل پیش‌بینی‌تر می‌شوند.

ترکیب NLP، یادگیری ماشین، ابزارهای تصویری و تحلیل پیش‌بینی‌محور، امکانات بی‌سابقه‌ای به محققین اوسینت داده است.

[1] https://www.techtarget.com/searchenterpriseai/tip/How-to-enhance-OSINT-investigations-using-AI

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا