An Overview of Efficient Interconnection Networks for Deep Neural Network Accelerators
چهارشنبه ۰۸ دى ۱۴۰۰
0 نظر
512 بازدید

بسمه تعالي

گزارش و تحليل مقاله

An Overview of Efficient Interconnection Networks
for Deep Neural Network Accelerators

مزایای قابل توجه AI منجر به پیشرفت در بسیاری از برنامه های دنیای واقعی ، مانند تشخیص گفتار و طبقه بندی تصویر شده است.هدف اصلی آموزش به حداقل رساندن زمان لازم برای همگرایی با یک دقت خاص است ، یعنی مربوط به توان عملیاتی سیستم است. آموزش معمولا برای دستیابی به توان عملیاتی بالاتر در چند گره یا حتی چندین خوشه به مقیاس کوچک و کوچکتر تبدیل می شود. برای استنباط ،تأخیر به اندازه توان تولید مهم است.دستگاه ها ، برای اجرای عملیات گستردهDNN به سیستم عامل های سخت افزاری قدرتمند نیاز دارند. با این وجود DNN های مقیاس بزرگ فعلی شامل ارتباطات پیچیده ، محاسبات گسترده و نیازهای ذخیره سازی ، که فراتر از توانایی دستگاه های جاسازی شده محدود کننده منابع مبتنی بر عناصر پردازش CPU وGPU برای اهداف عمومی است.این منجر به محبوبیت فزاینده اخیر در توسعه خاص دامنه سیستم عامل های محدودیت منابع با پردازش اختصاصی ، حافظه و منابع ارتباطی برای محاسبه DNN شده است.

جمع بندي و پيشنهاد براي کارهاي آتي

با تکثیر NN ها و به خصوص DNN ها ، طراحی شتاب دهنده های سخت افزاری برای آنها رونق دارد. برای پیشرفت عملکرد و استقرار انعطاف پذیر DNN ها ، قابل تنظیم است.interconnect با طرح های مختلف توپولو در طراحی DNN پیشنهاد و مورد توجه قرار گرفت. از طرف دیگر ، اتصال طراحی همچنین در محاسبات نوظهور بیشتر مورد توجه قرار گرفته است.پارادایمی مانند پردازش حافظه نزدیک / در حال اجرا که هدف آن چالش دیوار حافظه را تسخیر کند. برای جلوگیری از گلوگاه شدن اتصال اینترکون در چنین محاسباتی پارادایم ها ، نیاز به طراحی های پیشرفته تری دارند که می توانند پهنای باند بسیار بالا برای ارتباط بین عناصر مختلف شتاب دهنده های NN، فناوری های نوظهور مانند اتصال بی سیم و نوری نیز می تواند برای مقابله با معایب سیم معمولی ارتباطات متقابل به کارگرفته شود.

مراجع

[1] V. Sze, Y.-H. Chen, T.-J. Yang, and J. S. Emer, “Efficient processing of deep neural networks: A tutorial and survey,” Proc. IEEE, vol. 105,no. 12, pp. 2295–2329, Dec. 2017.
[2] K.-C. Chen, M. Ebrahimi, T.-Y. Wang, Y.-C. Yang, and Y.-H. Liao,“A NoC-based simulator for design and evaluation of deep neural networks,”Microprocess. Microsyst., vol. 77, Sep. 2020, Art. no. 103145.
[3] P. Mattson et al., “MLPerf training benchmark,” 2019,arXiv:1910.01500. [Online]. Available: http://arxiv.org/abs/1910.01500

براي مشاهده ويدئو روي تصوير زير کليک نماييد

فايل تحليل پروژه

فايل ارائه پروژه

نویسنده: ارغوان جافري
نام
ایمیل
متن نظر
عبارت داخل تصویر
 

ارتباط سنسورها و دستگاه‌ها با شبکه‌ای است که از طریق آن می‌توانند با یکدیگر و با کاربرانشان تعامل کنند. این مفهوم می‌تواند به سادگی ارتباط یک گوشی هوشمند با تلویزیون باشد یا به پیچیدگی نظارت بر زیرساخت‌های شهری و ترافیک.