بخش اکسپلور اینستاگرام را دیگر همهمان میشناسیم؛ جایی عالی برای پیدا کردن عکسها و ویدیوهایی عجیب که احتمالا قرار است بخش قابل توجهی از وقت ما را هم در لحظه ازآن خود کنند. حالا اینستاگرام به تازگی جزئیاتی را اعلام کرده تا بفهمیم که چطور این اپلیکیشن با استفاده از یادگیری ماشینی، محتوای نمایش داده شده در اکسپلور هر کاربر را انتخاب میکند. یک نکته مهم در این میان، این است که بخش اکسپلور نمیخواهد «پستهای جذاب» به ما نشان دهد، بلکه قرار است حسابهای کاربری را به ما معرفی کند که فکر میکند ما به آنها علاقه داریم.
ماهیت این پستی که اینستاگرام در بلاگ خود منتشر کرده، همانطور که انتظار داشتیم فنی است و هیچ نکته شگفتانگیزی هم درباره آن وجود ندارد. اما دیدن پشت صحنه و اینکه چطور الگوریتمهای این سیستم تحت نظر هستند تا کاربران را به سمت محتوای خطرناک، نفرتانگیز و افراطی سوق ندهند، جذاب است.
در حال حاضر اینستاگرام به اندازه یوتیوب برای پخش و نمایش محتواهای خطرناک، مورد انتقاد نیست. یوتیوب در این زمینه آنقدر ضعیف بوده که «نیویورک تایمز» به آن لقب «افراطگرای بزرگ» داده است. اما همچنان اینستاگرام هم در این زمینه درست مثل هر شبکه اجتماعی دیگری، با مشکل روبرو است. حتی گاهی دیده شده که برخی مکانیزمهای این اپلیکیشن باعث شده تا حسابهای کاربری که موضوعات حساسی مثل مقابله با واکسیناسیون را منتشر میکنند، پیشنهاد دهد.
در این پست جدیدی که در بلاگ اینستاگرام منتشر شده، مهندسین اینستاگرام توضیح میدهند که چطور بخش اکسپلور کار میکند و همزمان سعی میکنند از مشکلات حساسی که در این میان وجود دارد، دوری کنند. ایوان مدودف، مهندس نرمافزار در اینستاگرام، در یک ایمیل به وبسایت ورج اینطور توضیح داده که: «این اولین بار است که ما اینطور با جزئیات درباره بلوکهای اساسی که به ما کمک میکنند محتوای شخصی سازی شده را در این مقیاس آماده کنیم، توضیح میدهیم».
پست بلاگ اینستاگرام روی این نکته تاکید میکند که ما با یک شبکه اجتماعی عظیم روبرو هستیم و محتوایی که روزانه در آن منتشر میشود، دستهبندیهای کاملا مختلفی دارند. از خوشنویسیهای عربی بگیرید تا انواع مختلف اسلایمها! در چنین شرایطی، پیدا کردن محتوا و پیشنهاد دادن آنها به کاربران در صفحه اکسپلور، چالش بسیار بزرگی است. اینستاگرام نیز برای پشت سر گذاشتن این چالش، به جای اینکه روی پستها برای پیشنهاد دادن در صفحه اکسپلور تمرکز کند، روی حسابهای کاربری که ممکن است شما دوست داشته باشید تمرکز کرده و پستهای آنها را نمایش میدهد.
الگوریتمهای اینستاگرام میتوانند مشخص کنند که کدام حسابهای کاربری شبیه به یکدیگر هستند. این کار توسط یک متد یادگیری ماشینی به نام Word Embedding انجام میشود. اما این Word embedding اصلا چطور کار میکند؟ روش کار به این صورت است که سیستم ترتیب قرارگیری کلمات در کنار یکدیگر را تشخیص میدهد و سپس میفهمد که این کلمات چقدر به هم شبیه هستند. برای مثال، یک سیستم Word Embedding متوجه میشود که کلمه «آتش» معمولا در کنار کلماتی چون «زنگ خطر» قرار میگیرد و امکان اینکه «آتش» را در کنار کلمهای مثل «پلیکان» یا «ساندویچ» ببینیم، چیزی نزدیک به صفر است. اینستاگرام هم از چنین روشی استفاده میکند تا بفهمد که دو حساب کاربری چقدر شبیه به هم هستند تا بتواند محتوای یک حساب کاربری را در صفحه اکسپلور نمایش دهد.
برای پیدا کردن محتوای مناسب صفحه اکسپلور، اینستاگرام ابتدا از مفهومی به نام «اکانتهای بذر» یا Seed Accounts استفاده میکند. این اکانتها شامل حسابهای کاربری هستند که کاربر پیش از این با آنها تعامل داشته است. این تعامل میتواند شامل لایک کردن یکی از پستهای آن و یا سیو کردن یکی از آنها باشد. سپس الگوریتمهای اینستاگرام، اکانتهای دیگری که شبیه به این اکانتهای بذر هستند را پیدا و از آنها، ۵۰۰ پست را انتخاب میکند. حالا این ۵۰۰ کاندیدای انتخاب شده، فیلتر میشوند تا آنهایی که اسپم هستند، اطلاعات نادرست دارند و یا قوانین و مقررات اینستاگرام را زیر پا میگذارند، از این لیست ۵۰۰ تایی حذف شوند. سپس پستهای باقی مانده براساس اینکه کاربر چطور ممکن است با هر کدام از آنها تعامل داشته باشد انتخاب میشود. در نهایت، ۲۵ پست که از آنها انتخاب شده و در صفحه اول اکسپلور کاربر، نمایش داده میشوند.
اینجا چند نکته وجود دارد که نباید از آنها به سادگی گذشت. اول اینکه اینستاگرام به صورت کامل و با جزئیات، این پروسه را توضیح نمیدهد. هنوز هیچ اطلاعی نداریم که چطور اینستاگرام برخی از ۵۰۰ کاندیدا را به عنوان اسپم یا منتشر کننده اطلاعات نادرست، شناسایی میکند. و البته این موضوع خیلی هم جای تعجبی ندارد زیرا توضیح دادن روند دقیق انجام این فرآیند، به اسپمرها کمک میکند تا الگوریتمهای اینستاگرام را دور بزنند. همچنین Instagram نمیگوید که تا چه حد از یادگیری ماشینی استفاده میکند تا محتوایی که نامناسب است را شناسایی کند. دانستن این موضوع از آنجایی جالب توجه است که اخیرا فیسبوک، شرکت مالک اینستاگرام، گفته بود که AI یک گلوله جادویی برای ایجاد تعادل است.
بگذارید برویم سراغ مثال پستهایی که در رابطه با جنبش ضد واکسن هستند. اینستاگرام توانسته تا حد زیادی جلوی پیشروی محتواهای مرتبط با این جنبش را بگیرد اما بیشتر این کار را با روشهای دستی انجام داده است. برای مثال جلوی هشتگهایی که حاوی محتوایی هستند که «تایید شده اطلاعات نادرست دارند» مثل #vaccinescauseaids را گرفته است. همزمان به سازمانهای بهداشتی مثل World Health Organization اتکا میکند تا آنها پستهای خطرناک را شناسایی کنند و اینستاگرام آنها را حذف کند.
در این زمینه AI میتواند کاربردی باشد؟ هنوز نمیدانیم اما مدودف میگوید که این شرکت دارد روی این موضوع کار میکند. او به صورت مشخص گفته که: «ما همچنین در حال آموزش مدلهای هوش مصنوعی هستیم تا به صورت فعال بتواند پستهایی که اطلاعات غلط در مورد واکسن دارند را شناسایی کرده و به صورت خودکار در رابطه با آنها عمل کند».
نکته مهم دیگری که از این پست فهمیدهایم و خود اینستاگرام هم به آن اشاره کرده است، بهترین کار برای اینکه بتوانید به پستهایی که در تب اکسپلور شما قرار میگیرند جهت دهید، این است که بیشتر سراغ محتوایی بروید که به آن علاقه دارید. اگر هم میخواهید برخی پستها یا به طور دقیقتر اکانتهایی که در اکسپلور دیدهاید را دیگر نبینید، باید از ابزار see fewer posts like this استفاده کنید. برای دسترسی به این ابزار کافی است وقتی پستی را در تب اکسپلور باز میکنید، روی سه نقطه بالای پست بزنید و سپس این گزینه را انتخاب کنید. این دو روش، بهترین روشهایی هستند که با آن میتوانید الگوریتم اینستاگرام برای تب اکسپلور را باب میل خودتان تربیت کنید!