ترجمه‌ی احسان سنایی- ما با روش‌های معمولِ فشردگی ِ تصاویر رایانه‌ای آشنایی داریم. فرمت‌های تصویریِ معروفی نظیر .jpg یا .png، حاکی از تراکم میلیون‌ها پیکسل، در هیئتی کارآمدترند که بدون بروز دگرگونی ِ محسوسی در کیفیت تصویر؛ حجم آن را تا ۱۰برابر حتی کاهش می‌دهند. طبعاً مجموعه‌ای کامل از تصاویر غیرفشرده، حجم سرسام‌آوری را در حافظه‌ی رایانه‌مان به خود اختصاص خواهد داد و زمان زیادی را مصروف رد و بدل‌شان مابین شبکه‌های ارتباطی ِ گوناگون خواهد نمود.

مغز ما نیز با مشکل مشابهی روبروست. تصاویری که توسط سلول‌های حساس به نور واقع در شبکیه‌ی چشم‌مان ایجاد می‌شوند؛ ابعادی در حدود ۱ مگاپیکسل دارند، حال‌آنکه مغزمان ظرفیت مخابره یا ذخیره‌ی چنین حجمی از داده‌ها را آن‌هم در طول عمر یک انسان، ندارد. در عوض، این اندام بایستی‌که فقط ضروری‌ترین اطلاعات را برای کسب درکی کلی از جهان دیداریِ پیش روی‌اش، گلچین کند.

در شماره‌ی امروز نشریه‌ی Current Biology، تیمی از پژوهش‌گرانِ دانشگاه جان‌هاپکینز ایالات متحده، به سرپرستی عصب‌شناسانی به‌نام‌های دکتر «اد کونور» (Ed Connor) و دکتر «کچن ژانگ» (Kechen Zhang)، توصیفی اصولی از نحوه‌ی فشرده‌سازیِ داده‌های تصویری، توسط مغز انسان ارائه کرده‌اند. آنان دریافته‌اند که سلول‌های ناحیه‌ی V4، که مرحله‌‌ای میانی واقع در مسیر اصلی بخش ادراک بصری مغز است؛ نسبت به تشخیص زوایای تند موجود در تصاویر، فوق‌العاده به‌گزین شده‌اند. آزمایشاتی که توسط «اریک کارلسون» (Eric Carlson)؛ دانشجوی دکترا، صورت پذیرفته، نشان از این می‌دهد که سلول‌های V4 در برابر نواحی گوشه‌دار و یا یا خمیدگی ِ شدیدِ موجود در تصویر، حساس‌اند؛ و بالعکس، نسبت به زوایای گشوده‌تر و یا خمیدگی‌های هموارتر، حساسیت شدیدی از خود بروز نمی‌دهند.

«راسل راسکوئینا» (Russell Rasquinha) از دانشگاه تورنتو، و از کمک‌نویسندگان پژوهش مزبور؛ جهت درک نقش نحوه‌ی تشخیص انحناهای حاده در کمک به فشرده‌سازی داده‌های تصویری؛ مدلی رایانه‌ای متشکل از صدها سلول مشابه با V4 را پدید آورد و با هزاران تصویر از اجسام طبیعی، آشنایشان کرد. در این آزمایش، پس از آموزش ِ بصریِ سلول‌ها، مشخص شد که هر عکس، برخلاف حالت فشرده‌شده‌اش؛ واکنش‌های متفاوتی را از مجموعه‌ا‌ی وسیع از سلول‌های بصریِ V4، فرامی‌خوانَد. جالب اینجاست که این سلول‌های مصنوعی، دقیقاً برخلاف نمونه‌های طبیعی‌شان در مغز؛ اکثراً به سطوح صاف و منحنی‌های نرم عکس‌العمل نشان می‌دادند.

زمانی‌که واکنش‌های مدلِ سلولی به تصاویر پیش ِ روی‌اش محدودتر گردید؛ نتایج ِ آزمایش، اختلاف فاحشی یافتند. مادامی‌که محدوده‌ی واکنش‌پذیریِ سلول‌های بصریِ مزبور، کاهش می‌یافت؛ اولویت گزینش سلول‌ها نیز از انحناهایِ تصویریِ هموار، به منحنی‌های حاده‌تر تغییر می‌یافت. در محدودترین حالتِ ممکن، کاهشی هشت‌برابری در شمار سلول‌های واکنش‌دهنده پدید آمد؛ که تقریباً متناظر با تبدیل فایل‌های خام تصویری، به فرمت jpeg در رایانه است. در این حالت بود که مدلِ رایانه‌ای، تمایل شدیدی به ویژگی‌های‌ِ مشاهده‌شده در نمونه‌ی طبیعی ِ سلول‌های V4 از خود بروز داد.

اما چرا تمرکز بر زوایای حاده تا این حد از حجم تصویر را می‌کاهد؟ بدین‌دلیل که طبق مشاهداتِ تیم پژوهشی؛ زوایای تندِ اندکی را در قیاس با سطوح صاف و یا منحنی‌های نرم؛ در طبیعت می‌توان مشاهده کرد. واکنش به خصوصیاتِ نادر یک صحنه نیز طبیعتاً مقرون به‌صرفه‌تر است.

به‌گفته‌ی کونور؛ که هم‌اکنون استاد دپارتمان «سولومون اسنایدر» دانشکده‌ی عصب‌شناسی دانشگاه جان‌هاپکینز و نیز مدیر مؤسسه‌ی مغزی/ذهنی Zanvyl Krieger است؛ علی‌رغم ندرت نواحی ِ زاویه‌دار در پهنه‌ی طبیعت؛ این عوارض ِ دیدگانی، از نقش حائز اهمیتی در تشخیص و شناسایی ِ اشیاءِ طبیعی برخوردارند. او می‌گوید: «آزمایشات روان‌شناختی نشان از این داده‌اند که داوطلبین؛ در صورت حذف گوشه‌های هموار یک نقاشی نیز همچنان قادر به تشخیص گرته‌های اولیه‌ی طرح هستند؛ اما در صورت حذف زوایا یا دیگر نواحی ِ حاده‌، تشخیص ماهیت شیء برایشان دشوار می‌شود».

سازوکارهای مغزی نظیر طرح کدگذاریِ سلول‌های V4 که توسط کونور و همکاران‌اش از آن پرده‌برداری شده؛ به شرح علت نبوغ بصری ما انسان‌ها کمک خواهد کرد. کونور در ادامه می‌افزاید: «رایانه‌ها، در ریاضیات و شطرنج از ما پیشی جسته‌اند؛ اما قادر به تطابق با توانایی‌هایمان در تشخیص، شناسایی، درک، یادآوری و ویرایش اشیائی که جهان‌مان را شکل داده، نیستند». این توانایی ِ انسان، تا حدی به فشرده‌سازیِ داده‌های تصویری تا مقادیری کنترل‌پذیر، بستگی دارد. دست‌کم تاکنون، فرمت تصویریِ مغز، ظاهراً بهترین الگوریتم فشرده‌سازیِ موجود است.

منبع: University of John Hopkins

در همین زمینه:

نگاهی به آشنای ناشناخته – اسفندماه 88