چطور به کامپیوترها فهمیدن عکسها را میاموزیم

چطور به کامپیوترها فهمیدن عکسها را میاموزیم

 

ارائه‌ی خانم فِی فِی لی (از پژوهشگران برجسته‌ی حوزه‌ی بینایی ماشین و دانشیار دانشگاه استنفورد) در کنفرانس TED که در تاریخ ۳ فروردین ۹۴ در وب‌سایت TED بارگذاری شده است. ایشان از اعضای اصلی تیم جمع‌آوری کننده‌ی مجموعه داده‌ی Imagenet هستند که این مجموعه، نقش به سزایی در پیشرفت‌های قابل توجه شش سال اخیر در حوزه‌ی بینایی ماشین داشته است. در بخشی از این ارائه، ایشان راجع به پیشینه‌ی جمع‌آوری این مجموعه داده صحبت می‌کنند.
یکی از نکات مطرح شده در ارائه: انسان بطور متوسط در هر ۲۰۰ میلی ثانیه، زاویه‌ی دید خود را تغییر می‌دهد، یعنی در هر ثانیه بطور متوسط پنج تصویر جدید ثبت می‌کند. بنابراین، نوزاد انسان در سال‌های اولیه‌ی زندگی خود حجم قابل توجهی از تصاویر را برای پردازش به مغز خود تحویل می‌دهد. همین موضوع، بعنوان انگیزه‌ی اصلی جمع‌آوری Imagenet بیان شده است.