قد تكون ممارسة الطب في العصر الرقمي صعبة ومحبطة للغاية عندما يجلب المرضى معلومات خارجية إلى العيادة. هل تعلم أن عدداً هائلاً من المرضى يطلبون الآن التشخيص من روبوتات الدردشة قبل حتى تحديد موعد؟ إذا كنت تشهد تدفقاً للمرضى الذين يعتمدون على تشات جي بي تي (ChatGPT) للحصول على نصائح طبية، فلست وحدك. يُدخل هذا الاتجاه مخاطر جسيمة على سلامة الذكاء الاصطناعي السريري في الممارسة اليومية.
في الآونة الأخيرة، رُفعت دعوى قضائية بالقتل الخطأ ضد شركة أوبن إيه آي (OpenAI) تزعم أن ChatGPT قدم نصيحة دوائية قاتلة لأحد المستخدمين. تجبر هذه الحالة المجتمع الطبي على النظر عن كثب في المسائل القانونية والأخلاقية المحيطة بالذكاء الاصطناعي. فهذه النماذج ذات الأغراض العامة عُرضة للهلوسة. وتختلف اختلافاً شاسعاً عن الأدوات المُصرح بها التي نستخدمها في المستشفى. في هذا المقال، سنناقش تفاصيل الدعوى القضائية ضد OpenAI، وما تقوله أحدث الأبحاث حول دقة روبوتات الدردشة، وكيف يمكنك حماية مرضاك من الأذى.
دعوى OpenAI القضائية وما تعنيه للممارسة الطبية
تعد الأخبار الأخيرة حول مواجهة OpenAI لدعوى قضائية بسبب نصيحة دوائية يُزعم أنها قاتلة بمثابة جرس إنذار ضروري لكل طبيب. فقد أُفيد بوفاة مستخدم بعد اتباعه لنصيحة طبية أنشأها ChatGPT. وتجادل الدعوى بأن الشركة فشلت في منع البرنامج من تقديم توصيات طبية غير آمنة. إذا كنت تتساءل عما يعنيه هذا لممارستك اليومية، فالإجابة هي أن الخط الفاصل بين التكنولوجيا الاستهلاكية والأجهزة الطبية قد أصبح غير واضح تماماً بالنسبة للمرضى.
عندما يكتب المريض عَرَضاً في نافذة الدردشة، فإنه يتوقع إجابة موثوقة. ومع ذلك، لم تُصمم هذه المنصات لممارسة الطب. فهي تفتقر إلى حواجز الحماية الأساسية التي تحمي حياة الإنسان. قد تجد مرضى يعدلون جرعات أدويتهم بناءً على ما أخبرتهم به الخوارزمية. وهذا يفرض مسؤولية قانونية هائلة على كل من شركات التكنولوجيا والأطباء الذين سيتعين عليهم في النهاية التعامل مع التداعيات.
نعم، إن راحة الحصول على إجابات فورية أمر جذاب للجمهور. ومع ذلك، إذا لم تكن تسأل المرضى بنشاط عن مصدر معلوماتهم الصحية، فقد تفوتك فرصة تدخل حاسم. تثبت الدعوى القضائية ضد OpenAI أن مخاطر سلامة الذكاء الاصطناعي السريري لم تعد نظرية. بل لها عواقب حقيقية وقاتلة. يجب علينا التعامل مع روبوتات الدردشة الاستهلاكية كفئة جديدة من عوامل الخطر أثناء أخذ السيرة المرضية.
ما هي مخاطر سلامة الذكاء الاصطناعي السريري للنماذج اللغوية الكبيرة التي تقدم نصائح طبية؟
دعونا نلقي نظرة على المخاطر الفعلية للنماذج اللغوية الكبيرة عندما تحاول العمل كأطباء. تولّد هذه الأنظمة النصوص من خلال التنبؤ بالكلمة التالية بناءً على كميات هائلة من بيانات الإنترنت.
إنها لا تفهم البيولوجيا البشرية.
قيّم Draelos RL وآخرون في دورية NPJ digital medicine عام 2026 كيفية تعامل هذه النماذج مع الأسئلة الطبية التي يطرحها المرضى. ووجد الباحثون أن النماذج اللغوية الكبيرة تقدم إجابات غير آمنة بمعدل مقلق. فعند مواجهتها لحالات سريرية معقدة، غالباً ما قدمت النماذج إرشادات قد تؤدي إلى إلحاق ضرر مباشر بالمريض. فالخوارزمية ببساطة تخمن تسلسل الكلمات الأكثر ترجيحاً من الناحية الإحصائية، وهو أمر لا يماثل تشخيص المرض.
تكمن المشكلة الأساسية في الهلوسة. فقد يخترع النموذج بثقة تفاعلاً دوائياً لا وجود له. وقد يتجاهل أيضاً عَرَضاً يهدد الحياة لأن الوزن الإحصائي للمُدخل قاده إلى مسار حميد. أجرى Huo B وآخرون في دورية JAMA network open عام 2025 مراجعة منهجية للنماذج اللغوية الكبيرة فيما يخص النصائح الصحية لروبوتات الدردشة. ولاحظوا أنه على الرغم من أن النص يبدو احترافياً للغاية ومتعاطفاً، إلا أن المنطق السريري الأساسي غالباً ما يكون معيباً بشدة.
وهم التعاطف والخبرة
يثق المرضى في هذه الأدوات لأن الإجابات تحاكي أسلوب الطبيب المتعاطف في التعامل مع المريض. فالنبرة تبدو موثوقة. ومع ذلك، فإن هذه الثقة الاصطناعية هي بالضبط ما يجعل مخاطر سلامة الذكاء الاصطناعي السريري شديدة الخطورة. فالمريض الذي يقرأ إجابة مهذبة ومنسقة بشكل جيد يكون أقل ميلاً للتشكيك في الدقة الطبية للنصيحة. يمكنك الاطمئنان إلى أن خبرتك البشرية لا تزال غير قابلة للاستبدال، ولكن عليك التنافس مع آلة لا تتردد أبداً أو تعبر عن أي شك.
كيف تختلف أدوات الذكاء الاصطناعي الاستهلاكية عن الذكاء الاصطناعي السريري المصرح به من إدارة الغذاء والدواء (FDA)؟
من الضروري فهم الفرق بين النموذج اللغوي ذي الغرض العام والجهاز الطبي الخاضع للتنظيم. تستخدم المستشفيات بشكل متزايد الذكاء الاصطناعي لتحليل الصور الطبية أو التنبؤ بتعفن الدم. وتخضع هذه الأدوات لاختبارات صارمة وتصاريح تنظيمية. كما يتم تدريبها على مجموعات بيانات طبية محددة ومنسقة.
على العكس من ذلك، يتم تدريب نماذج مثل ChatGPT على شبكة الإنترنت المفتوحة. وهي مصممة لتكون حوارية ومتعددة الاستخدامات، وليس لتكون دقيقة طبياً. نشر Wu D وآخرون في ArXiv عام 2025 عملاً يركز على جعل النماذج اللغوية الكبيرة آمنة سريرياً. وأكدوا أنه بدون قيود صارمة، لا يمكن لهذه النماذج الالتزام بمبدأ «أولاً، لا تضر». تفتقر الأدوات الاستهلاكية إلى مسارات التفكير المنظمة المطلوبة لاتخاذ القرارات السريرية.
علاوة على ذلك، صُمم الذكاء الاصطناعي السريري الخاضع للتنظيم لمساعدة الطبيب المدرب. فهو بمثابة رأي ثانٍ داعم. بينما تعمل روبوتات الدردشة الاستهلاكية مباشرة كمستشار أساسي للمريض، متجاوزة الإشراف الطبي تماماً. هذا النموذج الموجه للمستهلك مباشرةً يُجرّد السياق من التاريخ الطبي الكامل للمريض، والفحص البدني، والنتائج المخبرية.
إلى جانب ذلك، توفر الأداة المصرح بها من قِبل إدارة الغذاء والدواء (FDA) نطاق ثقة شفاف. بينما يقدم روبوت الدردشة الاستهلاكي مجرد إجابة قاطعة، سواء كانت صحيحة أم خاطئة.
قابلية التعرض لحقن المُدخلات والإجابات المتلاعب بها
أحد أكثر مخاطر سلامة الذكاء الاصطناعي السريري إثارة للقلق هو سهولة تلاعب المستخدم بهذه النماذج. فالطريقة التي يصيغ بها المريض السؤال يمكن أن تغير النصيحة الطبية التي يتلقاها تماماً. درس Lee RW وآخرون في دورية JAMA network open عام 2025 قابلية تعرض النماذج اللغوية الكبيرة لحقن المُدخلات عند تقديم النصائح الطبية.
كانت النتائج مقلقة. فإذا قام المريض بتضمين صياغة أو افتراضات معينة في مُدخله، فغالباً ما سيتفق النموذج معه بدلاً من تصحيح الخطأ الطبي. على سبيل المثال، إذا سأل مستخدم عن كيفية استخدام مادة سامة لعلاج الصداع، فقد يقدم النموذج عن غير قصد جدولاً للجرعات بدلاً من إعطاء تحذير. وتعني الطبيعة الحوارية للذكاء الاصطناعي أنه يحاول تلبية طلب المستخدم، حتى لو كان هذا الطلب خطيراً من الناحية السريرية.
خطر الانحياز التأكيدي
غالباً ما يبحث المرضى عن معلومات تؤكد ما يعتقدونه بالفعل. فإذا اشتبهوا في حاجتهم إلى مضاد حيوي معين، يمكنهم بسهولة هندسة مُدخل يقود روبوت الدردشة إلى التوصية بهذا الدواء بالتحديد. يعمل الذكاء الاصطناعي كغرفة صدى بدلاً من كونه مهنياً طبياً موضوعياً. وهذا يجعل إدارة مخاطر سلامة الذكاء الاصطناعي السريري أكثر صعوبة، حيث يصل المرضى إلى العيادة مقتنعين بأن ذكاءً اصطناعياً متقدماً قد أثبت صحة تشخيصهم الذاتي.
هل يمكن للنماذج اللغوية الكبيرة إدارة حالات معينة بأمان؟
اختبر العديد من الباحثين مدى جودة تعامل هذه النماذج مع أمراض معينة. وجاءت النتائج متباينة للغاية وأظهرت مخاطر جسيمة على سلامة الذكاء الاصطناعي السريري. قيّم Zhang Y وآخرون في دورية World journal of gastroenterology عام 2025 النماذج اللغوية الكبيرة كأدوات لتثقيف المرضى حول مرض التهاب الأمعاء. ووجدوا أنه في حين استطاعت النماذج تلخيص الحقائق الأساسية، إلا أنها فشلت غالباً في تقديم إرشادات آمنة للهجمات المعقدة للمرض. فالمريض الذي يعاني من تفاقم شديد في التهاب القولون التقرحي قد يتلقى نصيحة بمجرد تغيير نظامه الغذائي، مما يخفي الحاجة إلى علاج عاجل بالستيرويدات.
وبالمثل، أجرى Giuffrè M وآخرون في دورية Alimentary pharmacology & therapeutics عام 2024 مراجعة منهجية حول استخدام النماذج اللغوية الكبيرة كروبوتات دردشة طبية في أمراض الجهاز الهضمي. ولاحظوا أن الذكاء الاصطناعي واجه صعوبة في تقديم التوصيات الغذائية الدقيقة وتعديلات الأدوية. فعند التعامل مع أجهزة معقدة مثل الجهاز الهضمي، يمكن لنهج عام أن يسبب ضرراً بسهولة.
علاوة على ذلك، غالباً ما تفشل النماذج في التعرف على الحالات الطارئة. فقد اختبر Fisch U وآخرون في دورية BMJ health & care informatics عام 2024 أداء النماذج اللغوية الكبيرة في التوصية بكيفية إدارة التهاب السحايا. يُعد التهاب السحايا حالة طارئة وحرجة للوقت. وقد كشفت الدراسة النوعية أن الذكاء الاصطناعي كثيراً ما قدم نصائح عامة بدلاً من توجيه المريض بشكل عاجل إلى قسم الطوارئ. ويمثل تأخير الرعاية في مثل هذه السيناريوهات تهديداً مباشراً لبقاء المريض على قيد الحياة.
تقييم النماذج اللغوية الكبيرة عبر التخصصات السريرية
إن أداء روبوتات الدردشة هذه ليس موحداً عبر مجالات الطب المختلفة. فقد بحث Wilhelm TI وآخرون في Journal of medical Internet research عام 2023 في استخدام النماذج اللغوية الكبيرة لتوصيات العلاج عبر ثلاثة تخصصات سريرية. وأظهرت الدراسة المقارنة أن الذكاء الاصطناعي أدى بشكل أفضل في المجالات التي تعتمد بشدة على البروتوكولات، ولكنه فشل تماماً في التخصصات التي تتطلب حكماً سريرياً شخصياً.
على سبيل المثال، عندما طُلب منه التعامل مع خوارزمية مباشرة، كان النص الناتج مقبولاً في كثير من الأحيان. ومع ذلك، في تخصصات مثل الطب النفسي أو الطب الباطني المعقد، ارتفعت مخاطر سلامة الذكاء الاصطناعي السريري بشكل حاد. لم تستطع النماذج التوليف بين الحالات المتعددة المتداخلة.
قارن Huang M وآخرون في دورية Frontiers in public health عام 2025 بين أداء النماذج اللغوية الكبيرة في استشارات طب العيون التي يبادر بها المريض. غالباً ما تظهر أمراض العيون بأعراض متشابهة، مثل الاحمرار، والتدميع، والألم. وعانت النماذج للتمييز بين التهاب الملتحمة الحميد والقرحة المهددة للبصر. إذا اعتمدت على هذه الأدوات في الفرز الطبي، فإنك تقبل بمخاطرة هائلة تتمثل في سوء التصنيف. وتُظهر البيانات أن الذكاء الاصطناعي ليس قريباً على الإطلاق من الاستعداد ليحل محل الاستشارات التخصصية البشرية.
القيود في العالم الحقيقي والأدلة المضادة
في بعض الحالات، لا تكون كل دراسة سلبية تماماً. فبعض الأبحاث تشير إلى أن الذكاء الاصطناعي يمكن أن يضاهي القراء البشريين في مهام ضيقة ومحددة للغاية. ومع ذلك، تحدث هذه النجاحات عادة في بيئات خاضعة للرقابة حيث يقوم الأطباء بمراجعة المخرجات. وتُظهر الأدلة المضادة أنه عندما يستخدم المرضى هذه الأدوات بشكل مستقل، ترتفع معدلات الخطأ بشكل كبير. فالأداة التي تؤدي أداءً جيداً في دراسة استعادية غالباً ما تفشل عند مواجهة الواقع الفوضوي للأعراض التي يُبلغ عنها المريض.
ما هو دور الإنفاذ التنظيمي في الذكاء الاصطناعي السريري؟
تسلط الدعوى القضائية ضد OpenAI الضوء على فجوة تنظيمية هائلة. ففي الوقت الحالي، توجد روبوتات الدردشة الاستهلاكية في منطقة رمادية. فهي لا تُسوق كأجهزة طبية، ومع ذلك يستخدمها ملايين الأشخاص للحصول على نصائح طبية. صرح Freyer O وآخرون في دورية The Lancet. Digital health عام 2024 أن أي دور مستقبلي للتطبيقات الصحية للنماذج اللغوية الكبيرة يعتمد كلياً على قيام المنظمين بفرض معايير السلامة.
وإلى أن تتدخل الهيئات التنظيمية، لن يكون لدى شركات التكنولوجيا أي حافز يُذكر لفرض قيود على نماذجها. وستستمر مخاطر سلامة الذكاء الاصطناعي السريري في النمو مع زيادة إمكانية الوصول إلى هذه النماذج. نحن بحاجة إلى إرشادات واضحة حول كيفية تصرف هذه الأنظمة عندما يُدخل المستخدم استفساراً طبياً. يجب إجبارها على إطلاق توقفات صارمة وتوجيه المستخدم إلى طبيب بشري.
مع ذلك، فإن التشريعات تتحرك ببطء. والتكنولوجيا تتطور بشكل أسرع مما يمكن للقانون مواكبته. في غضون ذلك، يقع العبء على الأطباء الممارسين للتعامل مع التداعيات. فنحن من يجب علينا تصحيح المعلومات المضللة ومعالجة الأحداث الضائرة الناجمة عن النصائح الطبية المهلوسة.
نصائح لمنع تعرض المرضى للأذى بسبب الذكاء الاصطناعي الاستهلاكي
نظراً لأننا لا نستطيع التحكم فيما يفعله المرضى على هواتفهم الذكية، يجب علينا تغيير طريقة تواصلنا في العيادة. والخطوة الأكثر أهمية هي التثقيف الاستباقي. يجب أن تسأل المرضى مباشرة عما إذا كانوا قد استشاروا روبوت دردشة بشأن أعراضهم. واجعل هذا جزءاً أساسياً من أخذ السيرة المرضية.
إذا أحضر المريض نسخة مطبوعة من ChatGPT، فلا ترفضها وحسب. استخدمها كفرصة للتعليم. واشرح مخاطر سلامة الذكاء الاصطناعي السريري المحددة المرتبطة بالأداة. أظهر لهم أين افترض الذكاء الاصطناعي افتراضاً خطيراً أو فوت جزءاً حاسماً من السياق. من خلال تفكيك الأخطاء، فإنك تبني الثقة وتُظهر قيمة الخبرة البشرية.
علاوة على ذلك، زود مرضاك بموارد رقمية موثوقة. امنحهم قائمة بالمواقع الإلكترونية وبوابات المرضى المعتمدة حيث يمكنهم العثور على معلومات دقيقة. إذا قدمت لهم بدائل آمنة، فمن غير المرجح أن يعتمدوا على نموذج لغوي غير مدقق. يجب أن نوجههم نحو منصات قائمة على الأدلة، مثل المبادئ التوجيهية للجمعيات الطبية الرسمية أو بوابات المستشفيات الآمنة.
خاتمة
مما لا شك فيه أن الدعوى القضائية بالقتل الخطأ ضد شركة OpenAI تمثل لحظة تاريخية للطب الحديث. فهي تجبرنا على مواجهة المخاطر الجسيمة على سلامة الذكاء الاصطناعي السريري المرتبطة بروبوتات الدردشة الاستهلاكية. يتجه ملايين المرضى إلى هذه الأدوات للحصول على إجابات، مما يعرضهم للهلوسة، والثغرات الأمنية لحقن المُدخلات، والأخطاء الطبية القاتلة.
في حين أن للذكاء الاصطناعي دوراً أساسياً في مستقبل الرعاية الصحية، إلا أن النماذج اللغوية ذات الأغراض العامة ليست آمنة لاتخاذ القرارات الطبية المستقلة. وكأطباء، يجب علينا تثقيف مرضانا بقوة حول القيود المفروضة على هذه الأدوات. كما يجب علينا أن نواجه بنشاط المعلومات المضللة التي تولدها. ومن خلال الحفاظ على التواصل المفتوح وتوجيه المرضى نحو موارد موثوقة، يمكنك الاطمئنان إلى أنك تقوم بدورك لحمايتهم من مخاطر الذكاء الاصطناعي السريري غير المدقق.
المراجع
- Huo B et al. Large Language Models for Chatbot Health Advice Studies: A Systematic Review. JAMA network open 2025. doi:10.1001/jamanetworkopen.2024.57879 (PMID: 39903463)
- Lee RW et al. Vulnerability of Large Language Models to Prompt Injection When Providing Medical Advice. JAMA network open 2025. doi:10.1001/jamanetworkopen.2025.49963 (PMID: 41632124)
- Wilhelm TI et al. Large Language Models for Therapy Recommendations Across 3 Clinical Specialties: Comparative Study. Journal of medical Internet research 2023. doi:10.2196/49324 (PMID: 37902826)
- Zhang Y et al. Evaluating large language models as patient education tools for inflammatory bowel disease: A comparative study. World journal of gastroenterology 2025. doi:10.3748/wjg.v31.i6.102090 (PMID: 39958450)
- Giuffrè M et al. Systematic review: The use of large language models as medical chatbots in digestive diseases. Alimentary pharmacology & therapeutics 2024. doi:10.1111/apt.18058 (PMID: 38798194)
- Freyer O et al. A future role for health applications of large language models depends on regulators enforcing safety standards. The Lancet. Digital health 2024. doi:10.1016/S2589-7500(24)00124-9 (PMID: 39179311)
- Huang M et al. Comparative performance of large language models for patient-initiated ophthalmology consultations. Frontiers in public health 2025. doi:10.3389/fpubh.2025.1673045 (PMID: 41059182)
- Wu D et al. First, do NOHARM: towards clinically safe large language models. ArXiv 2025. (PMID: 41532042)
- Fisch U et al. Performance of large language models on advocating the management of meningitis: a comparative qualitative study. BMJ health & care informatics 2024. doi:10.1136/bmjhci-2023-100978 (PMID: 38307617)
- Draelos RL et al. Large language models provide unsafe answers to patient-posed medical questions. NPJ digital medicine 2026. doi:10.1038/s41746-026-02428-5 (PMID: 41688533)
- https://www.mobihealthnews.com/news/openai-sued-over-alleged-fatal-chatgpt-drug-advice
Licensed physician and clinical AI specialist. Founder and Editor-in-Chief of ZayedMD, a physician-led medical publication covering clinical AI, neurology, metabolic health, and evidence-based patient guidance.



