چگونه با هوش مصنوعی، تحقیقات اوسینت را بهبود دهیم

نویسنده: Nihad Hassan
۲۵ فوریه ۲۰۲۵
مقدمه
امروزه ابزارهای دیجیتال نقش اساسی در زندگی روزمره دارند؛ از عملیات تجاری و ارتباطات گرفته تا اشتراکگذاری اطلاعات. همین اتکا گسترده به ابزارهای دیجیتال باعث تولید حجم عظیمی از دادههای قابلدسترسی عمومی شده است.
هر سال، جهان حدود ۱۲۰ زتابایت داده تولید میکند — یعنی بیش از ۲۵ تریلیون دیویدی! این دادهها منبع ارزشمندی برای کسبوکارها و نهادهای دولتی هستند. برای نمونه، محتواهای کاربران در شبکههای اجتماعی برای تحلیل احساسات عمومی یا رفتار مصرفکننده مورد استفاده قرار میگیرند.
اوسینت چیست؟
اوسینت به فرایند گردآوری و تحلیل دادههای در دسترس عموم، بهمنظور استخراج اطلاعات کاربردی و قابل اقدام گفته میشود. منابع آن عبارتند از:
- منابع اینترنتی: پستهای شبکههای اجتماعی، ویدیوها، فرومها، بلاگها، بانکهای اطلاعاتی عمومی.
- رسانههای سنتی: روزنامهها، مجلات، رادیو، تلویزیون.
- ادبیات خاکستری: کتابها، مقالات علمی، پایاننامهها.
- اسناد تجاری: ثبت شرکتها، کاتالوگها، پتنتها.
چه کسانی از اوسینت بهره میبرند؟
دولتها: برای ارزیابی احساسات عمومی، پیشبینی بحرانها و پیگیری تهدیدات.
نهادهای اطلاعاتی: برای کشف حملات سایبری، شناسایی بازیگران تهدید و مقابله با تروریسم.
بانکها و نهادهای مالی: برای بررسی مشتریان و تطبیق با مقررات.
کسبوکارها: برای تحلیل رقبا، رفتار مصرفکننده و طراحی استراتژی بازار.
رسانهها و فعالان حقوق بشر: برای راستیآزمایی، افشای حقایق و پیگیری تخلفات.
وکلای حقوقی و محققان خصوصی: برای بررسی پروندهها و جمعآوری شواهد.
تحلیلگران تهدیدات سایبری و تست نفوذ: برای جمعآوری اطلاعات هدف.
استفاده از هوش مصنوعی در اوسینت
با افزایش دادههای عمومی، استفاده از ابزارهای مبتنی بر AI برای افزایش سرعت و دقت در مراحل مختلف تحقیقات اوسینت ضروری شده است:
۱. خودکارسازی گردآوری داده
- ابزارهای AI در استخراج اطلاعات از فرمتهای مختلف مانند PDF، تصاویر، ویدیو، فایلهای متنی و اکسل بسیار مؤثرتر از اسکریپرهای سنتی هستند.
- این ابزارها میتوانند دادههای مفید را از وبسایتها، شبکههای اجتماعی، آرشیوها و دیتابیسها جمعآوری کنند.
نمونه ابزارها:
- AnyPicker : یک ابزار استخراج داده (Web Scraping) مبتنی بر هوش مصنوعی است که به کاربران اجازه میدهد بدون نیاز به کدنویسی، دادهها را از وبسایتها استخراج کنند. این ابزار با کمک رابط کاربری گرافیکی (GUI) کاربرپسند خود و الگوریتمهای یادگیری ماشین، میتواند بهصورت خودکار الگوهای داده را در صفحات وب تشخیص دهد و اطلاعات مورد نظر را استخراج کند.
- Browse AI : یک پلتفرم استخراج و پایش داده از وب مبتنی بر هوش مصنوعی است که بدون نیاز به کدنویسی به شما اجازه میدهد تنها با انتخاب نقاط مورد نظر، «رباتهایی» بسازید که سایتی را پیمایش، دادهها را استخراج و تغییرات را رصد کنند. این رباتها بهصورت خودکار صفحات را اسکرول میکنند، کپچا را مدیریت میکنند و اگر ساختار سایت تغییر کند، خود را تطبیق میدهند. خروجیها را میتوان به Google Sheets، CSV، JSON یا بیش از ۷۰۰۰ اپلیکیشن دیگر متصل کرد، و برای کارهای دورهای نیز امکان زمانبندی وجود دارد.
- ParseHub : یک ابزار پیشرفته وباسکریپینگ مبتنی بر هوش مصنوعی است که با رابط کاربری گرافیکی و بدون نیاز به کدنویسی، به شما امکان میدهد اطلاعات را از وبسایتهای پیچیده و پویا (مثل آنهایی که با JavaScript یا AJAX ساخته شدهاند) استخراج کنید. این ابزار قابلیتهایی مانند گردش در صفحات متعدد، اسکرول بینهایت، چرخش خودکار IP و زمانبندی خودکار استخراج را دارد و خروجیها را در فرمتهایی مانند CSV، JSON یا مستقیماً به Google Sheets منتقل میکند.
۲. تحلیل مجموعهدادههای بزرگ
- ابزارهای AI قادر به فیلتر و دستهبندی دادهها بر اساس کلمات کلیدی، احساسات، یا موجودیتهای خاص هستند.
- در تحلیل سیاسی یا امنیتی، میتوانند پستهایی با مضمون «اعتراض»، «تحریم»، یا «اعتصاب» را یافته و اولویتگذاری کنند.
- در فضای دارکوب، میتوانند به جستجوی واژههایی چون ransomware یا stolen credentials بپردازند.
نمونه ابزارها:
Ovis (تحلیل تصویر و ویدیو) : ابزار Ovis یک مدل هوش مصنوعی چندرسانهای (Multimodal AI) منبعباز است که توسط تیم AIDC-AI (وابسته به علیبابا) توسعه داده شده و برای تحلیل، تولید و ویرایش تصویر با متن طراحی شده است. جدیدترین نسخهی آن، Ovis-U1، یک مدل قدرتمند است که میتواند هم تصویر را بفهمد، هم بر اساس دستور متنی تصویر بسازد یا آن را ویرایش کند.
Lenso.ai (جستجوی تصویر) : یک موتور جستجوی معکوس تصویر مبتنی بر هوش مصنوعی محصول یک شرکت لهستانی (تأسیس ۲۰۲۴ در وراچواف) است که به شما این امکان را میدهد تا فقط با آپلود یک عکس، افراد، مکانها، تصاویر مشابه یا نسخههای تکراری آن را پیدا کنید.
Dataminr (تشخیص تهدید) : یک پلتفرم پیشرفتهی هشداردهی و تحلیل بلادرنگ است که با استفاده از هوش مصنوعی، اطلاعات حساس و فوری را از میلیونها منبع عمومی (از جمله شبکههای اجتماعی، وبسایتها، خبرگزاریها، دادههای حسگر و موارد دیگر) استخراج میکند. این ابزار به دولتها، شرکتها، سازمانهای خبری و امدادرسانی کمک میکند تا اتفاقات مهم را زودتر از منابع رسمی تشخیص دهند و سریع واکنش نشان دهند.
Paliscope (پلتفرم جامع اوسینت) : مجموعهای از ابزارهای پیشرفته OSINT و تحلیل دادههای دیجیتال برای محققان، روزنامهنگاران، نیروهای امنیتی و سازمانهای اطلاعاتی است، طراحیشده تا دادههای متنی، تصویری، صوتی و ویدئویی را با استفاده از هوش مصنوعی بهصورت درمحل (on-premise) و آفلاین تحلیل کند.
۳. خلاصهسازی دادهها
- ابزارهای پردازش زبان طبیعی NLP (میتواند اسناد و پستهای طولانی را خلاصه کند.)
- مثلاً در بررسیهای مالی، میتوانند گزارشهای پیچیده را خلاصه کرده و ناهنجاریها را برجسته کنند.
- همچنین، میتوانند افراد، مکانها، سازمانها و زمانها را از متون استخراج کنند.
۴. تحلیل پیشبینیمحور (Predictive Analytics)
- AI میتواند روندهای آینده را پیشبینی کرده و هشدارهای زودهنگام ارائه دهد. مثال: پیشبینی بحرانهای سیاسی یا اقتصادی با تحلیل افزایش گفتگو درباره تورم، بیکاری، یا قطع زنجیره تأمین.
- همچنین میتواند احساسات عمومی دربارهی یک انتخابات یا سیاست را با تحلیل میلیونها پست شبکههای اجتماعی ارزیابی کند.
ابزارهای تحلیل احساسات:
Free Sentiment Analyzer : ابزاری آنلاین برای تحلیل احساسات متون است که با استفاده از الگوریتمهای پردازش (زبان طبیعیNLP) به شما کمک میکند تا بفهمید متن وارد شده مثبت، منفی یا خنثی است. این ابزار معمولاً برای تحلیل نظرات کاربران، بازخوردها، شبکههای اجتماعی و دادههای متنی استفاده میشود و به سرعت نتایج را نمایش میدهد.
FaceReader (تحلیل چهره) : نرمافزاری پیشرفته برای تحلیل خودکار حالات صورت و شناسایی احساسات انسانی است که توسط شرکت Noldus توسعه یافته است. این ابزار با استفاده از الگوریتمهای بینایی ماشین و یادگیری عمیق، قادر به شناسایی و طبقهبندی دقیق حالات صورت در ویدئوها و تصاویر ثابت است.
Social Media Sentiment Visualization : به مجموعه ابزارها و تکنیکهایی گفته میشود که دادههای احساسی (Sentiment) استخراج شده از شبکههای اجتماعی را به صورت گرافیکی و بصری نمایش میدهند. هدف این نوع ویژوالیزیشن، کمک به درک بهتر روندها، احساسات عمومی و واکنشها نسبت به موضوعات خاص در پلتفرمهایی مانند توییتر، اینستاگرام، فیسبوک و غیره است.
جمعبندی
AI ستون فقرات آینده اوسینت است. بدون آن، تحلیل حجم انبوه دادهها نهتنها زمانبر بلکه پرخطا خواهد بود.
تحقیقات اوسینت با AI سریعتر، دقیقتر و قابل پیشبینیتر میشوند.
ترکیب NLP، یادگیری ماشین، ابزارهای تصویری و تحلیل پیشبینیمحور، امکانات بیسابقهای به محققین اوسینت داده است.
[1] https://www.techtarget.com/searchenterpriseai/tip/How-to-enhance-OSINT-investigations-using-AI



