ورود به حساب کاربری

نام کاربری *
رمز عبور *
مرا به خاطر بسپار.

بنیاد توسعه رایانش سریع و ابری

HPC and Cloud Computing Development Foundation

جریان موازی بین منابع HPC ناهمگون برای تحلیل زمان واقعی

چکیده

انجام تجزیه و تحلیل یا تولید تصویری همزمان با شبیه‌سازی با کارایی بالا می‌تواند مزایای زیادی در مقایسه با داده‌های پس پردازش داشته باشد. نوشتن و خواندن حجم زیادی از داده‌ها را می‌توان کاهش یا حذف کرد در نتیجه باعث صرفه‌جویی در هزینه I / O می‌شود.

یکی از این روش‌ها برای شبیه‌سازی همزمان و تجزیه و تحلیل داده‌های جاری در حال انتقال از منابع اجرای شبیه‌سازی به یک منبع جداگانه در حال اجرای تحلیل است. در تجزیه و تحلیل حمل و نقل می‌تواند سودمند باشد، زیرا منابع محاسباتی ممکن است منابع مشخصی برای تجسم و تجزیه و تحلیل (مانند GPU ها)  و برای کاهش تاثیر انجام کارهای تجزیه و تحلیل به زمان اجرای شبیه سازی نداشته باشند. در هنگام ارسال و دریافت داده‌ها در هنگام انتقال، مکانیزم‌های توزیع داده به منظور پشتیبانی از چیدمان‌های داده‌های ناهمگن به کار گرفته می‌شوند که ممکن است توسط برنامه‌های شبیه‌سازی و آنالیز مورد نیاز باشد.

کاری که در این مقاله شرح داده شد، دو مکانیزم برای توزیع مجدد داده در هنگام پخش داده‌ها به موازات دو کاربرد حافظه توزیع‌شده را مقایسه می‌کند. نتایج ما نشان می‌دهد که این امر اغلب برای داده‌های جریان در همان چیدمان به عنوان فرستنده و توزیع مجدد داده‌ها در فرآیند دریافت به جای داده‌های جریان در چیدمان نهایی مورد نیاز گیرنده، مفید است.

 

معرفی

شبیه‌سازی‌ها و آنالیز بر روی منابع محاسباتی با عملکرد بالا در حال هدایت دانش و مهندسی در مقیاس بزرگ هستند. برنامه‌هایی که روی این مقادیر بسیار موازی کار می‌کنند، سیستم‌های حافظه توزیع‌شده باید داده‌ها و محاسبه را بین فرآیندهای محاسبه انفرادی تقسیم کنند. یافته های کلیدی در 2014 DOE Performance Computing Operational Review بیان می‌کند که تجسم و تجزیه و تحلیل در محل و در حمل و نقل بیشتر رایج خواهد شد و باید به عنوان شهروندان درجه اول همراه با شبیه سازی HPC رفتار شود. همچنین گزارش می‌دهد که به علت محدودیت ورودی/خروجی ذخیره داده‌ها به دیسک، محاسبات به صورت ناگهانی افزایش می‌یابد.‌

در این مقاله، ما در حال بررسی تحقیقات در مورد بهبود عملکرد جریان موازی برای تجزیه و تحلیل ترانزیت بین دو برنامه کاربردی توزیع شده با توزیع داده‌های ناهمگن هستیم.  تحقیقات ما با تمایل به جریان داده‌های شبیه‌سازی از مراکز کامپیوتری با عملکرد بالا به یک سیستم محلی پژوهشگر برای آنالیز سایت (مانند تصویر visualizations با رزولوشن بالا)که بر روی یک صفحه نمایش کاشی شده مشاهده می‌شود، برانگیخته شد.. پس از برجسته سازی آثار مرتبط که پژوهش ما را تحریک می کنند، ما دو تکنیک برای جریان سازی و سازماندهی مجدد اطلاعات بین دو خوشه از راه دور را مورد بحث قرار می دهیم. اولین تکنیک وضعیت فعلی است و شامل شبیه‌سازی با دانستن طرح‌بندی موردنظر برای درخواست تجزیه و تحلیل دریافت و ارسال قطعات مربوط به داده‌ها به طور مستقیم به گره تجزیه و تحلیل مناسب است. تکنیک دوم، نقطه اوج تحقیق ما است و شامل هر گره در شبیه‌سازی است که تمام اطلاعات آن را به یک گره تجزیه و تحلیل در یک بار محاسبه شده ارسال می‌کند و پس از آن، برنامه تجزیه و تحلیل داده‌ها را به صورت محلی توزیع می‌کند تا آن را در طرح مورد نظر به پایان برساند. از آنجاییکه توزیع مجدد داده های محلی یک چالش به خودی خود است، پس ما در مورد توسعه‌مان از کتابخانه دینامیکی اطلاعات توزیع (DDR) بحث خواهیم کرد. کتابخانه DDR محاسبه می‌کند که چه داده‌هایی باید با هر فرآیند رد و بدل شود و روال MPI را خلاصه کند تا برنامه‌های HPC را مجددا در توزیع داده‌ها بین فرآیندها را تعریف کند. توسعه‌دهندگان برنامه باید به سادگی آنچه را که هر فرآیند در حال حاضر مالک است و داده‌های هر فرآیند را با توجه به دامنه کلی داده است را مشخص کنند.

 

جریان موازی با صفحه‌بندی داده‌های ناهمگون

 

 

توزیع مجدد داده پویا

 

 

 

 

______________________________________

برای دانلود و مطالعه کامل مقاله اینجا کلیک کنید.