انتخاب زبان

بهینه‌سازی شارژ مشارکتی برای شبکه‌های حسگر بی‌سیم قابل شارژ از طریق شارژرهای متحرک ناهمگن

پژوهش در مورد شارژ متحرک ناهمگن با استفاده از AAVها و SVها برای WRSNها، با الگوریتم IHATRPO که 39٪ بهبود عملکرد نسبت به HATRPO نشان می‌دهد.
wuxianchong.com | PDF Size: 1.5 MB
امتیاز: 4.5/5
امتیاز شما
شما قبلاً به این سند امتیاز داده اید
جلد سند PDF - بهینه‌سازی شارژ مشارکتی برای شبکه‌های حسگر بی‌سیم قابل شارژ از طریق شارژرهای متحرک ناهمگن

فهرست مطالب

1. مقدمه

شبکه‌های حسگر بی‌سیم قابل شارژ (WRSNها) یک پارادایم تحول‌آفرین را نشان می‌دهند که فناوری انتقال توان بی‌سیم (WPT) را با قابلیت‌های حسگری متعارف تلفیق می‌کند و به‌طور نظری طول عمر عملیاتی نامحدود را برای کاربردهای اینترنت اشیاء فراهم می‌سازد. شبکه‌های حسگر بی‌سیم سنتی با محدودیت‌های انرژی پایدار مواجه هستند که به شدت طول عمر شبکه و پایداری عملیاتی را محدود می‌کنند.

2. روش‌شناسی

2.1 معماری شارژر ناهمگن

معماری پیشنهادی، وسایل نقلیه هوایی خودکار (AAVها) و وسایل نقلیه هوشمند زمینی (SVها) را ترکیب می‌کند تا از مزایای مکمل آن‌ها در سناریوهای زمین‌های پیچیده بهره‌برداری کند. AAVها تحرک برتر و استقرار سریع را فراهم می‌کنند، در حالی که SVها استقامت گسترده‌تر و ظرفیت توان بالاتری ارائه می‌دهند.

2.2 فرمول‌بندی مسئله

مسئله بهینه‌سازی چندهدفه به موارد زیر می‌پردازد:

  • تعادل پویای مزایای شارژرهای ناهمگن
  • مبادلات بین بازدهی شارژ در مقابل مصرف انرژی تحرک
  • هماهنگی سازگار بلادرنگ تحت شرایط شبکه متغیر با زمان

2.3 الگوریتم IHATRPO

الگوریتم بهینه‌سازی سیاست منطقه اطمینان عامل ناهمگن بهبودیافته (IHATRPO)، مکانیزم‌های خودتوجهی را برای پردازش حالت‌های محیطی پیچیده یکپارچه می‌سازد و از استراتژی نمونه‌برداری بتا برای محاسبه گرادیان بی‌طرف در فضاهای عمل پیوسته استفاده می‌کند.

3. پیاده‌سازی فنی

3.1 چارچوب ریاضی

مسئله بهینه‌سازی به‌صورت بیشینه‌سازی تابع سودمندی شبکه فرمول‌بندی شده است:

$U = \sum_{i=1}^{N} \log(1 + E_i^{charged}) - \lambda \sum_{j=1}^{M} C_j^{mobility}$

که در آن $E_i^{charged}$ نشان‌دهنده انرژی تحویل‌داده‌شده به گره حسگر i است، $C_j^{mobility}$ نشان‌دهنده هزینه تحرک شارژر j است و $\lambda$ پارامتر مبادله است.

3.2 جزئیات الگوریتم

IHATRPO چارچوب بهینه‌سازی سیاست منطقه اطمینان را با موارد زیر گسترش می‌دهد:

  • مکانیزم‌های خودتوجهی برای پردازش بازنمایی‌های حالت پیچیده
  • نمونه‌برداری توزیع بتا برای فضاهای عمل پیوسته
  • هماهنگی عامل ناهمگن از طریق آموزش متمرکز با اجرای غیرمتمرکز

4. نتایج آزمایشی

4.1 معیارهای عملکرد

39%

بهبود عملکرد نسبت به HATRPO اصلی

95%

نرخ بقای گره حسگر به‌دست‌آمده

42%

بهبود بازدهی سیستم شارژ

4.2 تحلیل مقایسه‌ای

الگوریتم پیشنهادی IHATRPO به‌طور قابل‌توجهی از الگوریتم‌های پایه پیشرفته موجود از جمله DQN، PPO و HATRPO اصلی در معیارهای متعددی شامل بازدهی شارژ، مصرف انرژی و پوشش شبکه، بهتر عمل می‌کند.

5. پیاده‌سازی کد

شبه‌کد برای الگوریتم IHATRPO:

مقداردهی اولیه پارامترهای سیاست θ، پارامترهای تابع ارزش φ
برای تکرار=1,2,... انجام بده
    مجموعه مسیر D را با استفاده از سیاست π_θ جمع‌آوری کن
    تخمین‌های مزیت Â_t را با استفاده از GAE محاسبه کن
    سیاست را با بیشینه‌سازی هدف به‌روز کن:
        L(θ) = E[min(r_t(θ)Â_t, clip(r_t(θ), 1-ε, 1+ε)Â_t)]
    تابع ارزش را با رگرسیون روی V_φ به‌روز کن
    وزن‌های خودتوجهی را برای پردازش حالت به‌روز کن
پایان برای

6. کاربردهای آینده

معماری شارژ ناهمگن پیشنهادی کاربردهای امیدوارکننده‌ای در موارد زیر دارد:

  • پایش زیرساخت شهر هوشمند
  • سیستم‌های اینترنت اشیاء صنعتی و اتوماسیون
  • پایش محیط زیست در مناطق دورافتاده
  • پاسخ به فاجعه و شبکه‌های اضطراری
  • اتوماسیون کشاورزی و کشاورزی دقیق

7. مراجع

  1. J. Yao و همکاران، "بهینه‌سازی شارژ مشارکتی برای WRSNها از طریق شارژرهای متحرک ناهمگن،" IEEE Transactions.
  2. D. Niyato، "فناوری‌های شارژ بی‌سیم: اصول و کاربردها،" IEEE Communications Surveys & Tutorials، 2022.
  3. J. Schulman و همکاران، "بهینه‌سازی سیاست منطقه اطمینان،" ICML 2015.
  4. A. Vaswani و همکاران، "توجه تنها چیزی است که نیاز دارید،" NeurIPS 2017.
  5. L. Xie و همکاران، "انتقال توان بی‌سیم و برداشت انرژی: وضعیت فعلی و جهت‌های آینده،" Proceedings of the IEEE، 2023.

تحلیل تخصصی

نکته کلیدی: این مقاله به گلوگاه اساسی انرژی در استقرارهای اینترنت اشیاء با یک رویکرد ناهمگن هوشمندانه می‌پردازد، اما پیشرفت واقعی در نوآوری الگوریتمی است که هماهنگی بین شارژرهای هوایی و زمینی را از نظر محاسباتی امکان‌پذیر می‌سازد.

زنجیره منطقی: این پژوهش از یک پیشرفت واضح پیروی می‌کند: شناسایی محدودیت‌های سیستم‌های شارژ همگن → تشخیص نقاط قوت مکمل پلتفرم‌های هوایی در مقابل زمینی → فرمول‌بندی هماهنگی به‌عنوان یک مسئله بهینه‌سازی پیچیده → توسعه الگوریتم یادگیری تقویتی تخصصی برای حل آن. بهبود 39٪ نسبت به HATRPO نشان می‌دهد که مکانیزم خودتوجهی و نمونه‌برداری بتا فقط تنظیمات افزایشی نیستند، بلکه بهبودهای اساسی در رویکرد منطقه اطمینان هستند.

نقاط قوت و ضعف: نوآوری برجسته، یکپارچه‌سازی عملی مکانیزم‌های خودتوجهی است - مشابه آن‌چه در ترنسفورمرها که پردازش زبان طبیعی را متحول کردند - برای پردازش حالت‌های محیطی پیچیده در WRSNها. این نشان‌دهنده یک پیشرفت قابل‌توجه نسبت به رویکردهای یادگیری تقویتی سنتی است که با فضاهای حالت ابعاد بالا دست‌وپنجه نرم می‌کنند. با این حال، محدودیت اصلی مقاله، اتکا به نتایج شبیه‌سازی بدون اعتبارسنجی استقرار در دنیای واقعی است. مانند بسیاری از کاربردهای یادگیری تقویتی، شکاف بین عملکرد شبیه‌سازی‌شده و استحکام در دنیای واقعی همچنان قابل‌توجه است، همان‌طور که توسط چالش‌های مواجه‌شده در حوزه‌های دیگر مانند رانندگی خودکار که انتقال از شبیه‌سازی به واقعیت همچنان مشکل‌ساز است، مشهود است.

بینش عملی: برای متخصصان صنعت، این پژوهش نشان می‌دهد که سیستم‌های شارژ ناهمگن مرز بعدی در استقرارهای پایدار اینترنت اشیاء هستند. شرکت‌ها باید در توسعه زیرساخت‌های شارژ ترکیبی که از هر دو پلتفرم هوایی و زمینی بهره‌برداری می‌کنند، سرمایه‌گذاری کنند. رویکرد الگوریتمی نشان می‌دهد که مکانیزم‌های توجه برای مسائل هماهنگی پیچیده در سیستم‌های توزیع‌شده به طور فزاینده‌ای مهم خواهند شد. با این حال، احتیاط لازم است - تقاضای محاسباتی IHATRPO ممکن است برای دستگاه‌های لبه با منابع محدود مانع‌زا باشد، که نشان‌دهنده نیاز به نسخه‌های ساده‌شده برای استقرار عملی است.

این پژوهش به‌طور متفکرانه بر پایه‌های مستحکم یادگیری تقویتی بنا شده و در عین حال نوآوری‌های معناداری را معرفی می‌کند. در مقایسه با رویکردهای سنتی مانند پیاده‌سازی‌های DQN که با فضاهای عمل پیوسته دست‌وپنجه نرم می‌کردند، یا حتی PPO که فاقد پردازش حالت پیچیده IHATRPO است، این کار گامی قابل‌توجه به جلو را نشان می‌دهد. با این حال، همانند روزهای اولیه یادگیری بدون نظیر به سبک CycleGAN، انتقال از پیشرفت آکادمیک به کاربرد صنعتی نیاز به پالایش مهندسی قابل‌توجهی خواهد داشت.