به گزارش بی بدیل پرداز، وهاب میررکنی، دانش آموخته دانشگاه صنعتی شریف و MIT، جایزه معتبر مصطفی (ص) را برای توسعه الگوریتمی نوین در شناسایی شباهت داده ها و دسته بندی سریع داده ها از آن خود کرد.
به گزارش بی بدیل پرداز به نقل از مهر، جایزه مصطفی (ص) یکی از معتبرترین جوایز علمی و فناوری در جهان اسلام است که هر دو سال یک دفعه به محققان برجسته ای اهدا می شود که در عرصه های مختلف علمی و فناوری، دستاوردهای نوآورانه و تأثیرگذاری داشته اند. این جایزه به اثری نوآورانه در مرزهای دانش تعلق می گیرد که توسط افرادی شاخص در عرصه های علم و فناوری عرضه شده و زمینه ساز بهبود زندگی بشریت باشد.
در سال ۲۰۲۵، سه پژوهشگر برجسته از سه کشور مختلف در ششمین دوره جایزه مصطفی عرضه شدند که یکی از آن مهمت تونر، متولد ۱۹۵۸ در استانبول ترکیه است و توانست با توسعه فناوری میکروفیلویدیک در جداسازی سلول های تومور برای تشخیص فوری بیماریها در فهرست برگزیدگان قرار بگیرد. نفر دوم وهاب میررکنی پژوهشگر ایرانی است. میررکنی متولد ۱۹۷۹ بوده و با فعالیتهای برجسته در حوزه الگوریتم های هوش مصنوعی برگزیده ششمین دوره جایزه مصطفی شده است. سومین نفر هم محمد خواجه نذیرالدین، متولد ۱۹۵۷ در هند است که با فناوری سلول های خورشیدی حساس به رنگ و پروسکایت که نقشی مهم در توسعه انرژی پاک دارد، در فهرست برگزیدگان این دوره قرار گرفته است.
زندگینامه وهاب میررکنی پژوهشگر ایرانی برگزیده جایزه مصطفی
سفر و جست وجوی ذهن هر پژوهشگر، شبکه ای از سؤال ها،
تجربه ها و آزمون هاست که مسیر علم را شکل می دهد. وهاب میررکنی این مسیر را از دفترچه ای پر از مسایل در دوران کودکی شروع کرد و سپس از کلاس های مدرسه و مسابقات روباتیک به دانشگاه های معتبر جهان و لابراتوار های تحقیقاتی بزرگ رسید. تجربه های مختلف او نشان داده است که پیشرفت علمی نه یک مسیر خطی، بلکه شبکه ای از کشف ها، آزمون ها و تجارب متنوع است که همیشه در تعامل با مسایل واقعی زندگی شکل می گیرد.
مسیر علمی او از کلاس های مدرسه تا دانشگاه و تحقیقات صنعتی، همیشه با کشف و چالش همراه بوده است. وی در کلاس های دبیرستان استعدادهای درخشان کرج ساعت ها با دشوارترین پرسش ها دست و پنجه نرم می کرد. مسابقات المپیاد و رقابتهای جهانی RoboCup، اولین میدان های رشد او بودند؛ جایی که آموخت اعتماد به نفس و کار تیمی، زیربنای هر موفقیت بزرگ است. هنوز هم روزی را به یاد دارد که گروهشان در اروپا مقام اول را کسب نمود. برای او، ارزشمندتر از مدال ها، تجربه عمیق همکاری و خودباوری بود.
از دانشگاه صنعتی شریف تا دانشگاه MIT
ورود به دانشگاه مسیر او را از
آموزش های معمولی جدا کرد و به دانشگاه صنعتی شریف راه یافت؛ جایی که پروژه ها، مسابقات برنامه نویسی و روباتیک، عشقش به الگوریتم ها را عمق بیشتری بخشید.
این تجربیات، او را با راهکارهای خلاقانه برای مسایل پیچیده آشنا کرد. این عادت بعدها در پژوهش هایش به الگویی ثابت تبدیل شد: خرد کردن مسایل به بخش های کوچک، تحلیل دقیق و بازسازی آنها در ابعادی نو. در همین دانشگاه بود که فهمید باید آینده اش را در علوم نظری کامپیوتر بسازد؛ انتخابی که او را در سال ۲۰۰۵، به دانشگاه MIT در بوستون رساند. در بین ذهن های درخشان، غرق در دنیای علوم نظری کامپیوتر شد؛ محیطی که نه تنها به او آموخت چطور عمیق تر بیندیشد، بلکه به او یاد داد علم زمانی پرارزش است که با زندگی واقعی پیوند بخورد.
فعالیت در پروژه های بزرگ داده در گوگل ریسرچ
پس از فارغ التحصیلی از MIT، کار در آمازون و مایکروسافت ریسرچ برای میررکنی به عنوان یک لابراتوار زنده عمل کرد؛ جایی که باید الگوریتم های نظری را به راهکار هایی تبدیل می کرد که میلیون ها کاربر روزانه با آنها سروکار دارند؛ اما مقصد اصلی اش گوگل ریسرچ بود؛ جایی که بیشتر از یک دهه در پروژه های بزرگ و در مقیاس های عظیم فعال است. در اینجا با داده هایی کار می کند که گاهی به اندازه کل جمعیت زمین به هم مرتبط هستند. این تجربه مدام به او یادآوری می کند که علم زمانی معنا دارد که بتواند از دل تئوری، چاره ای برای واقعیت بیرون بکشد. او حالا ریاست گروههای تحقیقاتی الگوریتم ها در نیویورک را هم بر عهده دارد.
دامنه گسترده پروژه ها؛ از الگوریتم های بازار تا هوش مصنوعی نسل جدید
پروژه های وی از الگوریتم های بازار و بهینه سازی در مقیاس بزرگ تا گراف کاوی و پروژه های نسل جدید AI مانند Gemini AI گسترده است. دنیای هوش مصنوعی برای او همیشه یک ماجراجویی تازه است. هر ماه مدلها و روش های جدیدی معرفی می گردند که مرزهای تخیل روز گذشته را پشت سر می گذارند. آن چه بیشتر از همه او را شگفت زده می کند، توانایی سیستم ها برای یادگیری و بهبود خودشان است؛ پدیده ای که سرعت پیشرفت را از هر نمودار خطی فراتر برده است. آینده ای که پیش تر با سال ها فاصله قابل پیش بینی بود، امروز در عرض چند ماه دگرگون می شود. او این عدم قطعیت را نه تهدید، بلکه فرصتی ناب می بیند؛ فرصتی برای خلق ابزارها و ایده هایی که زندگی انسان را بشکلی عمیق تر با علم گره می زنند.
میررکنی همیشه بر این نکته تاکید دارد که هیچ موفقیتی واقعی نیست مگر آن که با دیگران به اشتراک گذاشته شود. او اعتقاد دارد که دستاوردها نه تنها حاصل تلاش فردی، بلکه نتیجه همکاری، اعتماد و همفکری گروههای پژوهشی است. این فلسفه در راه علمی او نمود یافته و جایزه مصطفی (ص) در سال ۲۰۲۵ به پاس دستاوردش در طرح هشینگ حساس به محل بر مبنای توزیع های p-پایدار، نمونه ای برجسته از این دیدگاه است. از دیگر جوایز دریافتی او میتوان به بهترین مقاله کنفرانس ACM در تجارت الکترونیک در سال ۲۰۰۸، بهترین مقاله دانشجویی سمپوزیوم ACM-SIAM در سال ۲۰۰۵ و مدال طلای المپیاد انفورماتیک ایران در سال ۱۹۹۶ اشاره نمود. خانواده، دوستان، همکاران و تیم های تحقیقاتی همگی نقش بسزایی در هر موفقیت این پژوهشگر داشته اند و این دستاوردها نتیجه اعتماد و همکاری جمعی است. بنابراین او هم خیلی از الگوریتم ها و کتابخانه های در رابطه با شبکه های عصبی گراف و داده کاوی را به شکل متن باز منتشر نموده است تا دیگران هم بتوانند از آن بهره گیرند و مسیر پیشرفت علمی ادامه یابد. برای او، علم همیشه محصول تلاش جمعی است و هیچ دستاوردی بدون همراهی دیگران کامل نمی گردد.
زندگی میررکنی تنها در معادلات و الگوریتم ها خلاصه نمی گردد. از دوران نوجوانی که فوتبال و پینگ پنگ بازی می کرد و لذت همکاری و رقابت دوستانه را می آموخت، تا امروز که شادی های کوچک بازی با فرزندانش را قدر می داند، همیشه تعادل میان علم، خانواده و جامعه را کلید رشد واقعی می داند. تجربه گذراندن وقت با بچه ها و یادگیری متقابل با آنها، یکی از ارزشمندترین لحظات زندگی اش است و حسی از رضایت و شادی به او می دهد که هیچ موفقیت علمی نمی تواند جای آنرا بگیرد.
توصیه میررکنی به نسل جوان: همه کارها را به هوش مصنوعی نسپارید
در کنار فعالیت هایش در گوگل ریسرچ، میررکنی به عنوان استاد مدعو در دانشگاه نیویورک در مؤسسه کورانت، الگوریتم ها و اقتصاد اینترنت را تدریس می کند و به نسل جوان گوشزد می کند: «اکنون بهترین زمان برای ورود به عرصه پژوهش است. سرعت پیشرفت ها در هوش مصنوعی فرصتی منحصربه فرد بوجود آورده تا رویاهایتان سریع تر از همیشه به واقعیت تبدیل شوند؛ اما فراموش نکنید، اگر همه کارها را به هوش مصنوعی بسپارید، مغزتان فرصت رشد و تکامل را از دست خواهد داد.» او آینده ای را می بیند که در آن انسان و هوش مصنوعی در کنار هم مسایل پیچیده ریاضی را حل می کنند و الگوریتم ها زندگی روزمره را در عرصه هایی مانند پزشکی، علوم اجتماعی و فراتر از آن بهبود می بخشند.
آشنایی با اثر میررکنی برگزیده جایزه ۲۰۲۵ مصطفی (ص)
شاید در نگاه اول، شباهت مفهومی ساده به نظر برسد؛ اما زمانیکه وارد دنیای داده ها می شویم، همین مفهوم ساده، شکلی دقیق تر و متفاوت تر به خود می گیرد. برای کامپیوترها، همه چیز صرفا دنباله ای از عددهاست. یک عکس بشکل فهرستی از عددهایی است که پیکسل ها را نشان می دهند یا حتی یک صدای ضبط شده، نوسانات فرکانس در قالب ارقامی پشت هم هستند. وقتی پا در جهانی می گذاریم که همه چیز عدد است، شباهت هم باید مبنی بر این عددها تعریف شود. در چنین فضایی، اگر بخواهیم بدانیم دو چیز چقدر به هم شبیه اند، باید بفهمیم که چقدر از هم فاصله دارند. چون در منطق ماشین، هرچه فاصله بین دو مجموعه کم تر باشد، تفاوت آنها هم کم تر می شود. بنابراین است که مفهوم فاصله به ابزار اصلی ما برای سنجش شباهت تبدیل می شود. البته اندازه گیری این فاصله، خود مساله ای مهم می باشد، چونکه راه های مختلفی برای محاسبه آن وجود دارد.
برای اندازه گیری این نزدیکی از روشی معروف به LPnorm استفاده می شود. این شیوه یک فرمول کلی دارد که با تغییر عددی به نام P، زاویه دید ما به مفهوم فاصله تغییر می کند. مثلا فرض کنید روی کاغذ دو نقطه رسم کرده اید و می خواهید فاصله شان را اندازه بگیرید. اگر خط کش را طوری بگذارید که خطی صاف و مستقیم میان آنها رسم شود، درحقیقت کوتاه ترین مسیر ممکن را اندازه گرفته اید. این همان حالتی است که p برابر ۲ دیده می شود و در ریاضیات به آن فاصله اقلیدسی می گویند. حالا تصور کنید که برای رسیدن از یک نقطه به نقطه دیگر، فقط اجازه داشته باشید حرکت های عمودی و افقی انجام دهید. در این حالت فاصله بین دو نقطه، با جمع کردن مقدار حرکت در هر مسیر افقی و عمودی به دست می آید. این نوع محاسبه برای زمانی است که p برابر با ۱ است و به آن فاصله منهتنی گفته می شود. اصولا عدد p مشخص می کند که سیستم به چه نوع تفاوتی بین داده ها بیشتر توجه کند.
حالا این مفهوم فاصله را به جهان دیجیتال وارد می نماییم، جایی که داده ها دیگر تصویر و صدا و جمله نیستند، بلکه بردارهایی از اعداد شده اند. همان گونه که پیشتر ذکر شد، در کامپیوتر هم برای سنجش شباهت بین دو تصویر یا متن، فاصله میان بردارها اندازه گیری می شود. مثلا وقتی یک موتور جست وجو باید تشخیص دهد که دو عبارت به یک مبحث اشاره دارند، یا وقتی برنامه ای موسیقی محور،
آهنگ های مشابه را پیشنهاد می دهد، آن چه پشت صحنه اتفاق می افتد همین مقایسه بردارهاست. در این راه، بسته به این که هدف الگوریتم دقت بالا باشد یا سرعت بیشتر، میتوان از مقادیر مختلف p استفاده کرد. درصورتی که بخواهیم به تفاوت های جزئی و دقیق دقت کنیم، مقدار 1p= انتخاب خوبی است، چون همه ی اختلاف ها با وزن مساوی وارد محاسبه می شوند؛ اما اگر بخواهیم یک دید کلی تر داشته باشیم، مقدار 2p= مناسب تر است. این مقدار به کامپیوتر اجازه می دهد با سرعت بیشتری، فاصله میان بردارها را تخمین بزند. نکته مهم اینست که برای تمام مقادیر p≥1، فاصله LP یک متریک معتبر است و خصوصیت های ریاضیاتی مانند قانون مثلث را حفظ می نماید اما اگر p<1 درنظر گرفته شود، هرچند میتوان همان فرمول را نوشت، نتیجه دیگر یک متریک واقعی نیست و قانون مثلث برقرار نمی ماند؛ بنابراین چنین حالتی بیشتر در مباحث نظری یا کاربردهای خاص استفاده می شود.
در علوم داده و یادگیری ماشین، به صورت معمول با p≥1 کار می شود چون هم شهود آن ساده تر است و هم از نظر ریاضی خواص خوبی مانند قانون مثلث را دارد. با این وجود پژوهش های نوآورانه ای مانند پژوهش های وهاب میررکنی، امکان بهره برداری مؤثری از p<1 را فراهم نموده اند و حالا کامپیوتر ها، بهتر و سریع تر از همیشه می توانند تفاوت ها را ببینند. هرچقدر هم روش خوبی برای سنجش شباهت بین داده ها داشته باشیم، باز هم با یک چالش بزرگ روبه رو هستیم. سرزمین داده ها بی انتهاست. میلیونها تصویر، متن، صدا و ویدئو در کامپیوتر ذخیره شده اند و اگر بخواهیم برای پیداکردن یک فایل خاص، همه این موارد را تک تک با هم مقایسه نماییم، زمان بسیار زیادی لازم خواهد بود. اینجاست که الگوریتمی هوشمندانه، حاصل کوشش های افرادی همچون میررکنی وارد ماجرا می شود. Locality-Sensitive Hashing یا به اختصار LSH، روشی برای دسته بندی سریع داده ها است.
LSH؛ روشی هوشمندانه برای دسته بندی سریع داده ها
در این الگوریتم، داده هایی که به هم شبیه اند، به آسانی در یک گروه قرار می گیرند؛ اما با وجود حجم بالای اطلاعات چه طور چنین چیزی ممکن است؟ LSH از ترفند جالبی استفاده می نماید. این شیوه به جای مقایسه مستقیم بردارهای طولانی، آنها را با کمک الگوریتم های ریاضی خاصی به نام توابع هش مخصوص، به بردارهایی کوتاه و خلاصه شده ای تبدیل میکند که هنوز اطلاعات مهم را حفظ می کنند. این مانند زمانی است که به جای خواندن تمام یک کتاب، چکیده ای هوشمند از آنرا دراختیار داشته باشیم که هنوز هم حال وهوای متن اصلی را منتقل می کند. LSH برای حفظ فاصله تقریبی بردارهای خلاصه شده، از ابزاری به نام توزیع Pپایدار استفاده می نماید.
خاصیت جادویی توزیع پایدار داده ها
این نوع توزیع، برداری تصادفی از عددها در اختیار ما قرار می دهد که با اعمال یک سری عملیات جبری با بردار اصلی، برداری خلاصه شده از داده ما حاصل شود. خاصیت جادویی این توزیع در اینست که فاصله بین خروجی ها، تقریب خوبی از فاصله میان داده های اصلی می شود. یعنی ما می توانیم بدون دست زدن به کل اطلاعات، با برداری کوتاه از هر داده، بفهمیم کدام یک به هم نزدیک ترند.
نکته دیگر در اینست که بسته به این که چه نوع فاصله ای اندازه گیری خواهد شد، از توزیع Pپایدار خاصی استفاده می شود. برای نمونه اگر فاصله اقلیدسی مدنظر باشد، باید بردارهای تصادفی مان را از توزیع Pپایداری به نام گاوسی انتخاب کنیم؛ چون این توزیع، برای محاسبه در زمان p=۲ است. برای مقادیر دیگر p، توزیع های مخصوص خودشان وجود دارند. به این ترتیب، میتوان با سرعت بالا داده های شبیه را بدون احتیاج به جست وجو طاقت فرسا دسته بندی کرد.
LSH؛ دستیاری با تجربه برای خلاصه سازی هوشمند
در این شیوه نو، دیگر نیازی نیست قالب داده ها را به کلی عوض نماییم یا آنها را در قالب های پیچیده جا بدهیم. همین سادگی عمل است که به سرعتی تعجب آور منجر گردیده است. LSH در بعضی آزمایش ها تا ۴۰ برابر از روش های سنتی مثل kd-tree سریع تر عمل کرده و حتی در وضعیت دشوارتر، مانند زمانیکه p کمتر از ۱ است، جست و جو را ممکن کرده است. خلاصه سازی
هوشمند، این شیوه را به دستیاری باتجربه در راه شناخت تفاوت ها مبدل کرده است. در دنیای عددها و بردارها، شاید احساسی در کار نباشد اما میتوان شباهت را با سرعتی چندبرابر تشخیص داد.