1. المقدمة
يتزايد الطلب على التفاعل بين الإنسان والحاسوب (HCI) الطبيعي والذكي بسرعة، مدفوعًا بالتطبيقات في مجال الألعاب والمنازل الذكية وواجهات السيارات. ومع ذلك، تواجه الطرق التقليدية قيودًا كبيرة: فشاشات اللمس تفشل في البيئات الرطبة/الدهنية، والكاميرات تثير مخاوف الخصوصية وتستهلك طاقة عالية، والتحكم الصوتي يواجه صعوبة في التعامل مع الأوامر المعقدة والخصوصية. من المتوقع أن يصل سوق واجهات الإنسان والآلة (HMI) العالمي إلى 7.24 مليار دولار أمريكي بحلول عام 2026، مما يؤكد الحاجة إلى حلول أفضل.
تقدم هذه الورقة البحثية تقنية EMGesture، وهي تقنية تفاعل لاتلامسية جديدة. تعيد هذه التقنية توظيف شاحن Qi اللاسلكي المنتشر في كل مكان ليعمل كجهاز استشعار للإيماءات من خلال تحليل الإشارات الكهرومغناطيسية (EM) المنبعثة أثناء الشحن. تتعرض هذه الإشارات للتشويش بسبب حركات اليد، حاملةً معلومات غنية متعلقة بالإيماءات. تقترح EMGesture إطار عمل متكاملًا لالتقاط ومعالجة وتصنيف هذه التشويشات، مقدمةً بديلاً عمليًا ومنخفض التكلفة ومراعيًا للخصوصية للتفاعل المنتشر.
%97+
دقة التعرف
30
مشارك
10+5
جهاز وشاحن تم اختبارهما
2. المنهجية وتصميم النظام
يحول EMGesture لوح شحن Qi اللاسلكي القياسي إلى منصة لاستشعار الإيماءات. لا يتطلب النظام تعديلًا في العتاد، بل يستخدم راديوًا معرفًا بالبرمجيات (SDR) أو مستشعرًا مدمجًا لمراقبة المجال الكهرومغناطيسي للشاحن.
2.1. الحصول على الإشارة الكهرومغناطيسية والمعالجة المسبقة
الإشارة الأساسية هي المجال الكهرومغناطيسي الناتج عن ملف إرسال الطاقة الخاص بالشاحن، والذي يعمل بترددات تتراوح حوالي 100-205 كيلوهرتز لمعيار Qi. عندما يؤدي يد المستخدم إيماءة بالقرب من الشاحن، تعمل اليد كوسط موصل، مشوشةً هذا المجال. يتم التقاط هذه التشويشات كبيانات جهد زمنية متسلسلة.
تتضمن المعالجة المسبقة:
- تصفية الضوضاء: تطبيق مرشحات تمرير النطاق لعزل نطاق التردد ذي الصلة لـ Qi من الضوضاء البيئية.
- التطبيع: قياس الإشارات لمراعاة أزواج الأجهزة/الشواحن المختلفة ومستويات الطاقة الأساسية.
- التجزئة: عزل نافذة الإشارة المقابلة لمثيل إيماءة واحدة.
2.2. استخراج الميزات وتصنيف الإيماءات
يتم تحليل الإشارة المعالجة مسبقًا لاستخراج الميزات التمييزية. نظرًا للطبيعة المتسلسلة للإيماءات، من المحتمل أن تُستمد الميزات من المجال الزمني والترددي على حد سواء:
- المجال الزمني: سعة الإشارة، معدل عبور الصفر، الطاقة.
- المجال الترددي: مركز الطيف، عرض النطاق، معاملات السيبستروم بتردد ميل (MFCCs) المعدلة للإشارات الكهرومغناطيسية.
- الزمني-الترددي: ميزات من تحويل فورييه قصير المدى (STFT) أو تحويلات المويجات لالتقاط الأنماط المتطورة.
يتم تدريب نموذج قوي للتعلم الآلي (مثل آلة ناقلات الدعم (SVM)، أو الغابة العشوائية، أو شبكة عصبية خفيفة الوزن مثل 1D-CNN أو LSTM) على هذه الميزات لتصنيف الإيماءات (مثل التمرير لليسار/اليمين، النقر، الدائرة). تعتبر متانة النموذج أمرًا أساسيًا للتعامل مع التباين بين المستخدمين والعتاد.
3. النتائج التجريبية والتقييم
3.1. دقة التعرف والأداء
أجرى المؤلفون تجارب شاملة مع 30 مشاركًا، و10 أجهزة محمولة مختلفة، و5 شواحن Qi. أظهر النظام دقة تعرف ملحوظة تزيد عن %97 لمجموعة محددة من الإيماءات (مثل التمريرات الاتجاهية، الدوائر، النقرات). تم الحفاظ على هذه الدقة العالية عبر مجموعات الأجهزة والشواحن المختلفة، مما يثبت قابلية تعميم النهج.
وصف الرسم البياني (مستنتج): من المحتمل أن يظهر رسم بياني متعدد الأعمدة نسب الدقة (المحور الصادي) لأنواع الإيماءات المختلفة (المحور السيني) مثل التمرير لليسار، التمرير لليمين، الدائرة، النقر، والدفع. يتم تقسيم كل شريط إلى أجزاء لإظهار الأداء عبر ظروف الاختبار المختلفة (مثل المستخدم 1-10، الجهاز أ-هـ). يشير خط علوي إلى متوسط الدقة الإجمالي الذي يحوم باستمرار فوق علامة %97.
3.2. دراسة المستخدم وتقييم سهولة الاستخدام
بالإضافة إلى الدقة، أجريت دراسات المستخدم لتقييم الجانب العملي. أبلغ المشاركون عن:
- راحة عالية: الاستفادة من جهاز موجود ومنتشر في كل مكان (الشاحن) ألغى الحاجة إلى أجهزة استشعار إضافية.
- تصور قوي للخصوصية: على عكس الكاميرات، لا يلتقط النظام بيانات بصرية أو بيومترية، بل مجرد تشويشات كهرومغناطيسية مجردة.
- سهولة الاستخدام: وجد أن الإيماءات بديهية وسهلة الأداء في سياقات مثل المكتب أو منضدة السرير.
تضع الدراسة تقنية EMGesture ليس فقط كتقنية قابلة للتطبيق تقنيًا، بل أيضًا كمقبولة من قبل المستخدم.
4. التحليل الفني والإطار النظري
4.1. الأساس الرياضي ومعالجة الإشارة
يمكن نمذجة تشويش المجال الكهرومغناطيسي بواسطة جسم موصل (اليد) من خلال التغيرات في الحث المتبادل والتيارات الدوامية المستحثة. يمكن اعتبار الإشارة المستلمة $s(t)$ على النحو التالي:
$s(t) = A(t) \cdot \sin(2\pi f_c t + \phi(t)) + n(t)$
حيث $A(t)$ هي السعة المتغيرة مع الزمن، $f_c$ هو تردد الموجة الحاملة (~110-205 كيلوهرتز)، $\phi(t)$ هي الطور، و $n(t)$ هي الضوضاء. تقوم الإيماءات بتعديل $A(t)$ و $\phi(t)$. غالبًا ما يتضمن استخراج الميزات حساب غلاف الإشارة $E(t)$:
$E(t) = |s(t) + j \cdot \mathcal{H}\{s(t)\}|$
حيث $\mathcal{H}\{\cdot\}$ هو تحويل هيلبرت، المستخدم للحصول على الإشارة التحليلية لاكتشاف الغلاف.
4.2. إطار التحليل: دراسة حالة غير برمجية
السيناريو: التحكم في مصباح مكتب ذكي (تشغيل/إيقاف، زيادة/تقليل السطوع) باستخدام إيماءات فوق لوح الشحن اللاسلكي المدمج فيه.
- تدفق الإشارة: يؤدي المستخدم إيماءة "دائرة". تغير حركة اليد المجال الكهرومغناطيسي المحلي لملف الشحن.
- مسار البيانات: يقوم محول من تماثلي إلى رقمي (ADC) على لوحة تحكم الشاحن بأخذ عينات من تيار/جهد ملف التغذية الراجعة (البيانات التي تتم مراقبتها بالفعل للتحكم في الشحن).
- إنشاء متجه الميزات: تتم معالجة نافذة العينة البالغة 500 مللي ثانية. يستخرج نموذج 1D-CNN ميزات مكانية-زمنية: على سبيل المثال، ارتفاع في طاقة الطيف منخفض التردد يتبعه نمط سعة دوري.
- التصنيف والإجراء: يطابق النموذج متجه الميزات مع فئة "الدائرة" بثقة %98. يترجم النظام هذا إلى الأمر: "التنقل بين درجات حرارة ألوان المصباح."
- فحص المتانة: يتجاهل النظام التشويشات الطفيفة (مثل وضع هاتف على اللوح) من خلال التحقق مما إذا كان نمط الإشارة يتطابق مع توقيع جهاز شحن معروف قبل تمكين وضع الإيماءات.
يسلط هذا الإطار الضوء على التكامل السلس للاستشعار في وظيفة موجودة مسبقًا.
5. المناقشة والاتجاهات المستقبلية
الفكرة الأساسية: تقنية EMGesture ليست مجرد تقنية إيماءات أخرى—بل هي نموذج متقن في إعادة توظيف البنية التحتية. حدد المؤلفون مصدر بيانات منتشرًا وصامتًا (المجال الكهرومغناطيسي لـ Qi) وحولوا مكون توصيل الطاقة إلى مستشعر سياقي. هذا يتجاوز إضافة أجهزة استشعار إلى الاستفادة مما هو موجود بالفعل، وهو مبدأ حاسم للحوسبة المنتشرة المستدامة والقابلة للتوسع، كما دعا إليه مارك وايزر في رؤيته الأصلية.
التسلسل المنطقي والمقارنة: الحجة مقنعة: الكاميرات تدخلية وتستهلك طاقة عالية، اللمس يفشل في البيئات غير النظيفة، الصوت صاخب. الإشارات الكهرومغناطيسية دائمًا قيد التشغيل، منخفضة الطاقة، ومجردة. مقارنة بالطرق الأخرى القائمة على الترددات الراديوية مثل Wi-Fi أو الرادار (مثل Soli من جوجل)، تكمن قوة EMGesture في بيئتها المقيدة والقابلة للتنبؤ (المجال القريب للملف)، مما يبسط معالجة الإشارة ويعزز الدقة، كما يتضح من نتيجة %97+—والتي غالبًا ما تكون أعلى من أعمال استشعار Wi-Fi المبكرة المبلغ عنها في منشورات مثل ACM MobiCom.
نقاط القوة والضعف: التطبيق الرائد هو خصوصيتها بالتصميم و تكلفتها الصفرية الهامشية للعتاد للأجهزة المزودة بشحن Qi. ومع ذلك، دعونا نكون نقديين: النطاق محدود بشدة (بضعة سنتيمترات)، مما يجعله تفاعلًا "على سطح المكتب" أو "بجانب السرير"، وليس على مستوى الغرفة. مفردات الإيماءات المحتملة صغيرة وبسيطة على الأرجح. كما أنها تعتمد على كون الشاحن نشطًا، وهو ما قد لا يكون الحال دائمًا. هناك تعارض محتمل بين محاذاة الشحن المثلى وبيئة عمل الإيماءات.
رؤى قابلة للتنفيذ والاتجاهات المستقبلية: 1. دفع نحو التوحيد القياسي: الفوز الحقيقي هو جعل معايير Qi 2.0 أو المستقبلية تتضمن قناة استشعار مخصصة وعرض نطاق منخفض بجانب نقل الطاقة. يجب أن يلاحظ صانعو الرقائق مثل NXP و IDT ذلك. 2. الدمج الواعي بالسياق: لا ينبغي للأنظمة المستقبلية الاعتماد على EM وحدها. يمكن لدمج إشارات النية الخاصة بها مع مقياس تسارع الجهاز (لاكتشاف "الرفع") أو الميكروفون (لتأكيد صوتي) أن يخلق أوامر قوية ومتعددة الوسائط. 3. توسيع المفردات: يجب أن يستكشف البحث إيماءات أكثر تعقيدًا وثلاثية الأبعاد باستخدام مصفوفات شواحن متعددة الملفات، مما قد يمكن من استخدام أبجدية لغة الإشارة فوق لوح الشحن. 4. قناة جانبية بيومترية: هل يمكن للاقتران السعوي الفريد ليد المستخدم أن يوفر إشارة مصادقة سلبية ومستمرة أثناء شحن الهاتف؟ هذا يدمج التفاعل مع الأمان.
في الختام، توفر EMGesture مسارًا عمليًا ببراعة نحو الأمام. لن تحل محل الكاميرات أو شاشات اللمس، لكنها تحفر مكانة حيوية لـ تفاعل محيطي وعرضي وخاص في مجال الأجهزة الشخصية، محولةً فعلًا روتينيًا—الشحن—إلى فرصة للاتصال.
6. المراجع
- Wang, W., Yang, L., Gan, L., & Xue, G. (2025). The Wireless Charger as a Gesture Sensor: A Novel Approach to Ubiquitous Interaction. In Proceedings of CHI Conference on Human Factors in Computing Systems (CHI '26).
- National Highway Traffic Safety Administration (NHTSA). (2023). Distracted Driving Fatality Data.
- Zhang, C., et al. (2020). A Survey on Vision-Based Human Activity Recognition. Image and Vision Computing, 103.
- Grand View Research. (2023). Human Machine Interface Market Size Report, 2023-2030.
- Malkin, N., et al. (2019). Privacy and Security in Voice-Based AI. IEEE Security & Privacy.
- Zhu, H., et al. (2021). Touchscreens in Wet Conditions: A Review. International Journal of Human-Computer Studies.
- Weiser, M. (1991). The Computer for the 21st Century. Scientific American.
- Pu, Q., et al. (2013). Whole-Home Gesture Recognition Using Wireless Signals. In Proceedings of ACM MobiCom.
- Wireless Power Consortium. (2023). Qi Wireless Power Transfer System Specification.