إمكانيات وقيود استخدام نموذج لغة كبير للرد على رسائل المرضى
اكتشف تأثير نماذج اللغة الكبيرة على رسائل المرضى وتعرف على كيفية قيام Mass General Brigham بتحسين تعليم المرضى. النتائج في لانسيت للصحة الرقمية.

إمكانيات وقيود استخدام نموذج لغة كبير للرد على رسائل المرضى
أظهرت دراسة جديدة أجراها باحثون في Mass General Brigham أن نماذج اللغة الكبيرة (LLMs)، وهي نوع من الذكاء الاصطناعي التوليدي، يمكن أن تساعد في تقليل عبء عمل الطبيب وتحسين تعليم المريض عند استخدامها لتكوين ردود على رسائل المرضى. وجدت الدراسة أيضًا قيودًا على شهادات LLM التي قد تؤثر على سلامة المرضى، مما يشير إلى أن المراقبة الدقيقة للاتصالات الناتجة عن LLMs أمر ضروري للاستخدام الآمن. النتائج المنشورة فيلانسيت الصحة الرقميةالتأكيد على الحاجة إلى نهج مدروس لتنفيذ LLM.
أدت زيادة المتطلبات الإدارية والتوثيقية إلى زيادة إرهاق الأطباء. لتبسيط سير عمل الطبيب وأتمتته، اعتمد موردو السجلات الصحية الإلكترونية (EHR) خوارزميات الذكاء الاصطناعي التوليدية لمساعدة الأطباء على كتابة رسائل للمرضى. ومع ذلك، فإن فعالية وسلامة وتأثير استخدامها السريري لم تكن معروفة.
يتمتع الذكاء الاصطناعي التوليدي بالقدرة على تقديم أفضل ما في العالمين، مما يقلل العبء على الطبيب مع تثقيف المريض بشكل أفضل. ومع ذلك، استنادًا إلى خبرة فريقنا في العمل مع LLMs، لدينا مخاوف بشأن المخاطر المحتملة المرتبطة بدمج LLMs في أنظمة المراسلة. وبما أن دمج LLM في السجلات الصحية الإلكترونية أصبح أكثر شيوعًا، كان هدفنا في هذه الدراسة هو تحديد الفوائد وأوجه القصور ذات الصلة.
دانييل بيترمان، دكتوراه في الطب،المؤلف المقابل،عضو هيئة تدريس في برنامج الذكاء الاصطناعي في الطب (AIM) في مستشفى ماس جنرال بريجهام وطبيب في قسم علاج الأورام بالإشعاع في مستشفى بريجهام والنساء
بالنسبة للدراسة، استخدم الباحثون برنامج OpenAI's GPT-4، وهو ماجستير إدارة أعمال أساسي، لإنشاء 100 سيناريو حول مرضى السرطان وسؤال المريض المصاحب. لم تستخدم الدراسة أسئلة من المرضى الفعليين. أجاب ستة من أطباء الأورام بالإشعاع على الأسئلة يدويًا؛ ثم قام GPT-4 بإنشاء إجابات للأسئلة. وأخيرا، تم تقديم الردود الناتجة عن LLM إلى نفس علماء الأورام بالإشعاع للمراجعة والتحرير. لم يعرف علماء الأورام بالإشعاع ما إذا كان GPT-4 أو إنسانًا قد كتب الإجابات، وفي 31% من الحالات افترضوا أن الإجابة التي تم إنشاؤها بواسطة LLM قد كتبها إنسان.
في المتوسط، كانت الاستجابات التي كتبها الطبيب أقصر من الاستجابات التي كتبها LLM. يميل GPT-4 إلى تضمين المزيد من التعليم للمرضى ولكنه كان أقل توجيهًا في تعليماته. أفاد الأطباء أن دعم LLM أدى إلى تحسين كفاءتهم الملموسة واعتبروا الاستجابات الناتجة عن LLM آمنة بنسبة 82.1 بالمائة من الوقت ومقبولة لإرسالها إلى المريض دون مزيد من المعالجة بنسبة 58.3 بالمائة من الوقت. لاحظ الباحثون أيضًا بعض أوجه القصور: إذا تركت دون معالجة، فإن 7.1% من الاستجابات الناتجة عن LLM يمكن أن تشكل خطرًا على المريض و0.6% من الاستجابات يمكن أن تشكل خطر الوفاة، ويرجع ذلك في الغالب إلى فشل استجابة GPT-4 في إبلاغ المريض بشكل عاجل لطلب رعاية طبية فورية.
تجدر الإشارة إلى أن الاستجابات التي تم إنشاؤها بواسطة LLM/التي تم تحريرها من قبل الطبيب كانت أكثر تشابهًا في الطول والمحتوى مع الاستجابات التي تم إنشاؤها بواسطة LLM مقارنة بالاستجابات اليدوية. في كثير من الحالات، احتفظ الأطباء بالمحتوى التعليمي الذي أنشأته LLM، مما يشير إلى أنهم وجدوه ذا قيمة. في حين أن هذا يمكن أن يعزز تثقيف المرضى، يؤكد الباحثون أن الاعتماد المفرط على ماجستير إدارة الأعمال قد يشكل أيضًا مخاطر بسبب عيوبها المثبتة.
إن ظهور أدوات الذكاء الاصطناعي في مجال الرعاية الصحية لديه القدرة على إحداث تحول إيجابي في استمرارية الرعاية، ومن الضروري تحقيق التوازن بين إمكاناتها للابتكار مع الالتزام بالسلامة والجودة. يعد Mass General Brigham رائدًا في الاستخدام المسؤول للذكاء الاصطناعي ويجري بحثًا متعمقًا حول التقنيات الجديدة والناشئة لدعم دمج الذكاء الاصطناعي في تقديم الرعاية الصحية ودعم القوى العاملة والعمليات الإدارية. يقود Mass General Brigham حاليًا مشروعًا تجريبيًا لدمج الذكاء الاصطناعي التوليدي في السجل الصحي الإلكتروني لكتابة الردود على رسائل بوابة المرضى ويقوم باختبار التكنولوجيا في عدد من ممارسات العيادات الخارجية عبر النظام الصحي.
للمضي قدمًا، سيقوم مؤلفو الدراسة بدراسة كيفية إدراك المرضى للتواصل القائم على LLM وكيف تؤثر الخصائص العرقية والديموغرافية للمرضى على الاستجابات الناتجة عن LLM استنادًا إلى التحيزات الخوارزمية المعروفة في LLM.
وقال بيترمان: "إن إبقاء الإنسان على اطلاع يعد خطوة سلامة أساسية عندما يتعلق الأمر باستخدام الذكاء الاصطناعي في الطب، ولكنه ليس حلاً واحدًا يناسب الجميع". "نظرًا لأن مقدمي الخدمات يعتمدون أكثر فأكثر على ماجستير إدارة الأعمال، فقد نفوت الأخطاء التي قد تؤدي إلى ضرر للمريض. تظهر هذه الدراسة الحاجة إلى أنظمة لمراقبة جودة ماجستير إدارة الأعمال، وتدريب الأطباء على مراقبة نتائج ماجستير إدارة الأعمال بشكل مناسب، والمزيد من مهارات الذكاء الاصطناعي للمرضى والأطباء." وعلى المستوى الأساسي، فهم أفضل لكيفية التعامل مع الأخطاء التي يرتكبها حاملو شهادة الماجستير في القانون.
مصادر:
تشن، س.، وآخرون. (2024) أثر استخدام النموذج اللغوي الكبير في الرد على رسائل المرضى.لانسيت للصحة الرقمية. doi.org/10.1016/S2589-7500(24)00060-8.