على مدى أكثر من عام، عمل قادة البيانات والذكاء الاصطناعي بجد على حالات استخدام الذكاء الاصطناعي التوليدي. بينما أظهرت تجربتهم إمكانيات كبيرة لهذه التقنية، إلا أنها كشفت أيضًا عن العديد من التحديات التي تعوق توسيع نطاق استخدامها. وتظل إدارة البيانات إحدى العوائق الرئيسية أمام تحقيق الفوائد الكاملة من الذكاء الاصطناعي التوليدي. في استطلاع حديث أجرته ماكنزي، أفاد 70٪ من أفضل الشركات بأنهم واجهوا صعوبات في دمج البيانات في نماذج الذكاء الاصطناعي، بما في ذلك مشاكل تتعلق بجودة البيانات، وتعريف عمليات حوكمة البيانات، وتوفير بيانات تدريب كافية1.
المزيد من الرؤى والتقارير من ماكنزي باللغة العربية
شاهد مجموعة المقالات الخاصة بنا باللغة العربية، واشترك في النشرة الإخبارية العربية الشهرية
من خلال تجربتنا، وجدنا أن المؤسسات تعاني من صعوبات في تطوير قدراتها لدعم تطبيقات الذكاء الاصطناعي التوليدي على نطاق واسع، وكذلك في استخدام هذا الذكاء لتحسين ممارسات البيانات. ستتناول هذه المقالة ثلاث خطوات أساسية يمكن لقادة البيانات والذكاء الاصطناعي اتخاذها للانتقال من التجارب الأولية إلى تطبيق الحلول على نطاق واسع. وتركز الخطوة الأولى على كيفية تحسين جودة البيانات وجعلها جاهزة للاستخدام في تطبيقات الذكاء الاصطناعي التوليدي. وتستعرض الخطوة الثانية كيفية استخدام الذكاء الاصطناعي التوليدي لبناء منتجات بيانات أفضل باستخدام منصات البيانات المحدثة. أما الخطوة الثالثة، فتتناول الاعتبارات الرئيسية لإدارة البيانات التي تتيح إعادة استخدامها والإسراع من وتيرة تطوير حلول البيانات.
البداية من المصدر: أهمية تحسين جودة بياناتك لتحقيق نتائج دقيقة وفعالة
لطالما كانت جودة البيانات مصدر قلق رئيسي لقادة البيانات والذكاء الاصطناعي. ولكن مع ظهور نماذج الذكاء الاصطناعي التوليدي، أصبحت المخاطر والتكاليف الناجمة عن إدخال بيانات ذات جودة منخفضة أكثر حدة وأهمية. تشمل هذه المخاطر نتائج غير دقيقة، وتكاليف باهظة للإصلاح، وخروقات أمنية، وفقدان ثقة المستخدمين في مخرجات النماذج. وفقًا لاستطلاع أجرته ماكنزي لعام 2024، أشار 63% من المشاركين إلى أن أكبر خطر يواجهونه في استخدام الذكاء الاصطناعي التوليدي2 هو عدم دقة المخرجات، ويمثل هذا زيادة بمقدار سبع نقاط مئوية مقارنةً بالعام السابق.
إن الأساليب التقليدية لضمان جودة البيانات لم تعد كافية في ظل التحديات الحالية. لذلك، يجب على القادة التفكير في طرق جديدة لتحسين وتوسيع بيانات المصدر الخاصة بهم. ومن أجل تحقيق ذلك، ينبغي أن ينظروا في اعتماد تقنيات متقدمة وأدوات حديثة، بالإضافة إلى تحسين العمليات والبنى التحتية للبيانات.
الحصول على بيانات مصدر أفضل وأكثر دقة من خلال معالجة الأنواع المعقدة من البيانات
تواجه المؤسسات تحديات كبيرة في التعامل مع التعقيد المتزايد لمجموعات البيانات غير المهيكلة. على سبيل المثال، قد ترغب البنوك في تحليل كل من البيانات المالية المهيكلة، مثل تاريخ المعاملات، بالإضافة إلى البيانات غير المهيكلة، مثل القوائم المالية وتحليلات السوق، لتقييم الجدارة الائتمانية للشركات. ومع ذلك، فإن الجمع بين البيانات المهيكلة وغير المهيكلة ومعالجتها يزيد من احتمالية الأخطاء. ويرجع السبب في ذلك هو أن الفرق الداخلية والخبراء المتخصصين، على الرغم من امتلاكهم المعرفة اللازمة، يجدون صعوبة في توثيق هذه المعرفة وتحويلها إلى عمليات منهجية واضحة يمكن اتباعها بسهولة في تدفق البيانات. ويعقد هذا التحدي من عملية إدارة البيانات وتحليلها بفعالية، الأمر الذي يؤدي إلى زيادة مخاطر الأخطاء.
وفي الواقع، لقد تطورت الأدوات التكنولوجية بشكل كبير لتساعد في التعامل مع البيانات المعقدة ومختلفة المصادر. على سبيل المثال، يمكن للرسوم البيانية المعرفية توضيح العلاقات المعقدة بين مختلف الكيانات، مما يوفر سياقًا غنيًا ومفيدًا لنماذج اللغة الكبيرة ومجموعات البيانات التابعة لها. وبدورها تُسهل هذه القدرات تحويل البيانات من شكل غير منظم، مثل النصوص الحرة، إلى شكل منظم، مثل الجداول، بدقة عالية. ونتيجة لذلك، يمكن تقليل الأخطاء وتحسين دقة التحليل وفهم البيانات بشكل أعمق، مما يعزز من قيمة المعلومات المستخلصة وكفاءة استخدامها.
حتى عندما يفهم مهندسو البيانات العلاقة بين مجموعات البيانات المختلفة، فإنهم يحتاجون إلى استخدام طرق متنوعة لتفسير تلك البيانات بناءً على خصائصها، مثل تنسيق البيانات. على سبيل المثال، يمكن أن تكون البيانات على شكل ملفات "PDF"، أو عروض "PowerPoint"، أو مستندات "Word"، أو ملفات صور. تزيد هذه التنسيقات المختلفة من تعقيد عملية التحليل، خاصة عندما تحاول الشركات دمج هذه التنسيقات في أنظمتها. ومع ذلك، فإن النماذج متعددة الوسائط المتقدمة الآن توفر حلاً لهذه المشكلة. هذه النماذج قادرة على تحليل أنواع المستندات الأكثر تعقيدًا التي تحتوي على تنسيقات بيانات مختلفة. على سبيل المثال، يمكن للنماذج متعددة الوسائط استخراج البيانات الجدولية من مستندات غير مهيكلة، مما يسهل عملية تحويل البيانات من شكل غير منظم إلى شكل منظم، ويزيد من دقة التحليل وفهم البيانات.
وعلى الرغم من أن النماذج متعددة الوسائط أصبحت أسهل في الاستخدام، إلا أنها لا تزال ترتكب أخطاء، (وأحيانًا تكون مكلفة). تتطلب هذه الأخطاء مراجعة مستمرة، والتي غالبًا ما تكون يدوية. على سبيل المثال، يقضي بعض مهندسي البيانات وقتًا طويلًا في مقارنة النتائج بين شاشتين. ومع تزايد عدد حالات الاستخدام، تصبح هذه الطريقة اليدوية غير فعالة بشكل سريع مع مضي الوقت. لذلك، يجب على قادة البيانات التركيز على استخدام أساليب آلية لتقييم النتائج، وتطوير نظم لإدارة الإصدارات المختلفة للنماذج، وإنشاء نظام لتقييم مدى ملاءمة البيانات المستخدمة. ستساعد هذه الخطوات في تحسين دقة وثبات نتائج النماذج متعددة الوسائط، وتجعل العملية أكثر كفاءة.
أدركت شركة استثمار ما أنها بحاجة لتحسين طريقة الوصول إلى البيانات واستخدامها لتنفيذ مساعد افتراضي. ولتحقيق هذا الهدف، قامت الشركة بعدة خطوات: أولاً، بنوا نظامًا لمعالجة البيانات غير المهيكلة، مثل النصوص والصور، وتحويلها إلى بيانات منظمة يمكن استخدامها بسهولة. ثانيًا، تأكدوا من أنهم يستخدمون أحدث النسخ من كل وثيقة. ثالثًا، قاموا بتنسيق طول المقالات لتناسب القراءة على الهواتف المحمولة. من ثم استخدم مهندسو البيانات في الشركة تقنيات متقدمة لتحويل البيانات المعقدة إلى بيانات منظمة، كما قاموا ببناء نظام "الميدالية" الذي يساعد في تنظيم البيانات بشكل فعال. بالإضافة إلى ذلك، أضافوا نظامًا لإدارة النسخ وتقييم مدى ملاءمة البيانات لتحسين دقة النتائج. وبفضل هذه الجهود، استطاعت الشركة بدء العمل على حالات استخدام، مثل تقييم الجدارة المالية للشركات، باستخدام نظام ذكاء اصطناعي متقدم، وذلك في غضون أسبوعين فقط.
توليد البيانات في حالة عدم توفرها
تواجه بعض حالات استخدام الذكاء الاصطناعي التوليدي صعوبات في التنفيذ بسبب صعوبة الحصول على البيانات المطلوبة ومعالجتها. هذه المشكلة تظهر بشكل خاص في قطاعات مثل الرعاية الصحية أو علوم الحياة، أو القطاعات الأخرى التي تخضع للوائح صارمة تتعلق بأمان البيانات. وللتغلب على هذه التحديات، قد يقوم مهندس البيانات في بعض الأحيان بتوليد ملف يدويًا لاختبار فعالية حالة الاستخدام. غير أن هذه العملية قد تكون مستهلكة للوقت وغير فعالة. ولذلك، تحتاج المؤسسات إلى إيجاد طرق أكثر كفاءة لجمع ومعالجة البيانات لضمان نجاح تطبيقات الذكاء الاصطناعي التوليدي في مثل هذه البيئات الحساسة.
وبدلاً من الاعتماد على الطرق التقليدية لجمع البيانات، يستثمر قادة البيانات والذكاء الاصطناعي في أدوات الذكاء الاصطناعي التوليدي لخلق وانتاج بيانات اصطناعية. ويمكن استخدام هذه البيانات الاصطناعية كبيانات اختبار أو لإنتاج قيم جديدة تعتمد على أوصاف الأعمدة وسياق الجدول. هذا يسمح لهم بإنشاء مجموعات بيانات جديدة أو تعديل المجموعات الموجودة. وقد قامت بعض الشركات بالفعل باستخدام مولدات البيانات الاصطناعية لإنشاء مجموعات بيانات تشبه إحصائيًا البيانات الأصلية. هذا الأسلوب يساعد على تحسين عمليات الاختبار والتطوير دون الحاجة إلى البيانات الأصلية التي قد تكون حساسة أو صعبة الحصول عليها.
الإسراع من وتيرة تطوير منتجات البيانات القابلة لإعادة الاستخدام عن طريق تسخير قدرات الذكاء الاصطناعي التوليدي
تعد منتجات البيانات، على سبيل المثال تلك التي تقدم عرض شامل عن العملاء، أساسية لكيفية استخدام الشركات وتسخيرها للبيانات من أجل تحقيق فوائد كبيرة3. ومع ذلك، فإن تطوير هذه المنتجات يمكن أن يكون معقدًا ويستغرق وقتًا طويلاً. لكن مع تحسين جودة البيانات واستخدام أدوات الذكاء الاصطناعي التوليدي الحديثة، تستطيع الشركات تسريع عملية التطوير وتحسين النتائج. على سبيل المثال، تمكنت إحدى شركات الضيافة من تسريع إنشاء نماذج بيانات العملاء بنسبة تصل إلى 60٪، وزيادة الإنتاجية في تطوير الميزات بنسبة 50٪. وقد حققت الشركة هذه الأهداف من خلال التركيز على توليد خطوط تحويل البيانات تلقائيًا باستخدام"PySpark" وتوثيق كل التحويلات المعقدة بدقة. بفضل هذه الأدوات، تمكنت الشركات من تجاوز الصعوبات التقليدية في تطوير منتجات البيانات، مما ساعدها على تحقيق نتائج أفضل في وقت أقل.
عملية التحول إلى إنشاء شامل لمنتجات البيانات من البداية إلى النهاية
كانت التكنولوجيا المتاحة حتى وقت قريب تحد من إمكانية إنشاء خطوط بيانات شاملة، مثل نظام 'الميدالية'، مما يتطلب اتباع نهج شاق يتم خطوة بخطوة. ومع تطور الذكاء الاصطناعي التوليدي، أصبح بإمكان مهندسي البيانات تنفيذ مهام معينة بكفاءة أكبر، مثل توليد جداول فردية من اللغة الطبيعية. ومع ذلك، يبقى على هؤلاء المهندسين إكمال سلسلة من الخطوات الأخرى التي تسبق وتلي هذه العملية، مثل دمج جميع الجداول معًا لتحقيق تكامل البيانات. وبالرغم من أن الذكاء الاصطناعي التوليدي يحسن الكفاءة في بعض المهام، إلا أن العمليات اليدوية لا تزال ضرورية لضمان تكامل البيانات بشكل صحيح.
بدلاً من الأساليب التقليدية، بدأ قادة البيانات والذكاء الاصطناعي في اعتماد نهج شامل لبناء خطوط بيانات من البداية إلى النهاية عن طريق أتمتة جميع الخطوات اللازمة. هذا النهج يسهم في توفير كبير في الوقت، حيث يمكن أن يصل التوفير في بعض الحالات إلى 80-90 بالمائة. بالإضافة إلى ذلك، يؤدي هذا النهج إلى تحسين القدرة على التوسع لمجالات استخدام محددة، مما يعني أن الشركات يمكنها تنفيذ عملياتها بشكل أكثر كفاءة وعلى نطاق أوسع.
كانت كتابة أكواد خطوط البيانات لتوليد منتجات البيانات واحدة من المهام الأكثر استهلاكًا للوقت بالنسبة لمهندسي البيانات في السابق. ومع ذلك، أصبحنا نشهد الآن تطورًا كبيرًا في أتمتة هذه العملية باستخدام لغات البرمجة مثل "SQL" و "Python"، تتيح هذه الأتمتة إنشاء نماذج بيانات كاملة يمكنها معالجة حالات استخدام متعددة في نفس الوقت. وبدلاً من التركيز على نطاق ضيق من العمل، مثل توليد جدول واحد استجابة لطلب بلغة طبيعية، أصبح بالإمكان الآن توليد عشرات الجداول كنموذج بيانات شامل ومتكامل. هذا النموذج قادر على تقديم حلول لمجموعة متنوعة من حالات الاستخدام في وقت واحد.
وقبل أن تتمكن أي مؤسسة من البدء في استخدام تقنيات الذكاء الاصطناعي التوليدي لتحسين قدراتها على توليد البيانات، يجب عليها أولاً التأكد من أن لديها بيانات موثوقة وسهلة الفهم ومتاحة. بالنسبة للشركات التي قامت ببناء قاعدة بياناتها على مدار سنوات عديدة، يُعد فهم الأكواد القديمة والبيانات الحالية جزءًا أساسيًا من هذه العملية. ومع ذلك، تواجه العديد من الشركات صعوبات بسبب ضعف تتبع مصدر البيانات أو نقص في فهرستها، مما يؤدي إلى فهم محدود لكيفية توليد البيانات. استجابةً لهذه التحديات، وقد بدأت بعض الشركات في استخدام تطبيقات الذكاء الاصطناعي التوليدي المتقدمة لتحليل الأكواد القديمة وتوليد أوصاف نصية بلغة طبيعية. هذا النهج لا يساعد فقط في تحسين فهم المؤسسة لقاعدة الأكواد الخاصة بها، بل يسهل أيضًا عملية إنشاء فهارس بيانات شاملة. فمن خلال هذه الفهارس، يمكن تحديد الأجزاء المكررة من الأكواد وإزالتها، مما يعزز من كفاءة ووضوح إدارة البيانات داخل المؤسسة.
تعزيز التناسق من خلال تحسين التنسيق وإدارة البيانات
يتطلب تطوير تطبيقات الذكاء الاصطناعي التوليدي تنسيقًا دقيقًا وتجزئة واضحة للمهام، مما يسهل إعادة استخدام القدرات المميزة بسهولة. ومع ذلك، تواجه الأساليب التقليدية للتكامل المستمر والتسليم المستمر صعوبة في تحقيق هذا الهدف. والسبب الرئيسي هو أن هذه الأساليب لا تستطيع الحفاظ على التناسق اللازم بين برامج الذكاء الاصطناعي التوليدي، وذلك بسبب الأنشطة الفريدة المرتبطة بهذه التطبيقات، مثل هندسة الطلبات. لهذا السبب، تحتاج المؤسسات إلى اعتماد أساليب جديدة وأكثر تخصصًا في التنسيق وإدارة البيانات لضمان التناسق والكفاءة في تطوير تطبيقات الذكاء الاصطناعي التوليدي.
ولمواجهة التحديات في توسيع استخدام وكلاء الذكاء الاصطناعي التوليدي، بدأ قادة البيانات والذكاء الاصطناعي باستخدام أطُر عمل تعتمد على الوكلاء. تساعد هذه الأطُر في تنظيم وتنسيق العمل بين وكلاء الذكاء الاصطناعي المختلفين، مما يسهل استخدامهم وإعادة استخدامهم. وفي الواقع، أطُر العمل هذه مزودة بقدرات مثل التفكير، وتنفيذ الأكواد، واستخدام الأدوات، والتخطيط، وإدارة سير العمل. تساعد هذه القدرات في حل المشاكل المتعلقة بالنماذج اللغوية الكبيرة، مثل صعوبة إدارة العمليات، وأخطاء التحقق، وتعقيدات تصميم سير العمل. باستخدام هذه الأطُر، يمكن للمؤسسات إدارة المهام المعقدة بشكل أفضل وتحسين الأداء العام وزيادة الموثوقية والقيمة ورضا المستخدمين. على سبيل المثال، تستخدم بعض الشركات هذه الأطُر في برامج الدردشة التفاعلية أو في أنظمة استرجاع المعلومات، مما يساعد على تحسين الكفاءة وتقديم خدمة أفضل.
ولتحسين إدارة منتجات البيانات الخاصة بهم، تلجأ العديد من الشركات إلى استخدام مجموعة متنوعة من الأدوات. بينما تعتمد بعض الشركات على الأدوات الجاهزة، لتواجه هذه الأدوات عادة صعوبات في التعامل مع السيناريوهات المعقدة، مثل توليد الأفكار تلقائيًا من البيانات غير المهيكلة. لذلك، تتجه الشركات نحو استخدام كتالوجات بيانات مدعومة بالذكاء الاصطناعي التوليدي، التي تتيح وضع العلامات الوصفية في الوقت الحقيقي. ومن خلال هذه الكتالوجات، يمكن توليد العلامات الوصفية تلقائيًا من المحتوى المهيكل وغير المهيكل، بالإضافة إلى إنشاء علامات ذكية. هذه العملية تؤدي إلى تحسين اكتشاف البيانات، مما يساعد الشركات على اختيار البيانات المناسبة لنماذج الذكاء الاصطناعي التوليدي. بالتالي، تعزز هذه الأدوات من كفاءة استخدام البيانات وتسهيل العثور على المعلومات الضرورية.
نقل وتحديث منتجات البيانات
قبل أن تبدأ الشركات في استخدام تقنيات الذكاء الاصطناعي التوليدي، مثل ترجمة الأكواد، لنقل منتجات البيانات وخطوط البيانات الخاصة بها من منصة إلى أخرى، يجب عليها أولاً تحديد النموذج اللغوي الكبير المناسب لهذه المهمة. فعلى الرغم من أن العديد من الشركات تعتمد على النماذج اللغوية التي يوفرها مزود الخدمة السحابية، إلا أن بعض هذه النماذج تكون مدربة بشكل أفضل على لغات برمجة معينة مقارنة بغيرها. على سبيل المثال، قد يكون أحد النماذج أكثر ملاءمة لكتابة أكواد "PySpark" التي تُستخدم في خطوط البيانات، بينما يكون هناك نموذج آخر أكثر كفاءة في كتابة أكواد "Terraform" التي تُستخدم لتطوير البنية التحتية ككود. لذا، يمكن للشركات الاستفادة من هذه النماذج لتسهيل عملية الانتقال إلى المنصات التي تعتمد على "PySpark" أو "SQL". ومع ذلك، في بعض الحالات، قد يتطلب الأمر تحسينات دقيقة على النموذج لضمان الأداء الأمثل، وذلك يعتمد على لغة البرمجة أو الإطار المستخدم.
ولفهم أي النماذج اللغوية الكبيرة يجب استخدامها مع لغات البرمجة المختلفة، وأتمتة ترجمة الأكواد بين هذه اللغات، يمكن للشركات نقل خطوط البيانات من الأنظمة القديمة والخدمات التي يتم إدارتها إلى موارد سحابية حديثة بكفاءة أكبر. هذه العملية تساعد على تحسين سير العمل وجعل الانتقال إلى التكنولوجيا الحديثة أكثر سلاسة. ومع ذلك، قد يتطلب تحديد النموذج اللغوي المناسب وقتًا إضافيًا للاختبار. لذلك، يجب على قادة البيانات والذكاء الاصطناعي أن يأخذوا هذا الوقت في الاعتبار عند تخطيط مشاريعهم. وبتخصيص وقت كافٍ للاختبار، يمكنهم ضمان اختيار النموذج الأكثر فعالية، مما يساهم في تحقيق نتائج أفضل في نقل وتحديث البيانات.
توسيع نطاق الذكاء الاصطناعي التوليدي مع ضمان معايير الأمان والبرمجة
يواجه قادة البيانات والذكاء الاصطناعي تحديات كبيرة في إدارة وحوكمة الاستخدام المتزايد بسرعة للبيانات غير المهيكلة. إن انتشار نماذج وتطبيقات الذكاء الاصطناعي التوليدي لا يضيف فقط مخاطر جديدة تتعلق بالأمان والجودة، بل يعوق أيضًا عملية التوسع. السبب في ذلك هو أن الفرق المختلفة داخل الشركة غالبًا ما تستخدم أدوات ونهجًا مختلفة، وأحيانًا تكون هذه الأدوات والنهج متضاربة.
من خلال حماية البيانات في كل مرحلة من مراحل عملية التطوير وأتمتة عملية دمج أفضل ممارسات البرمجة، يمكن للشركات تقليل المخاطر وفرض المعايير اللازمة لتوسيع نطاق حلول الذكاء الاصطناعي التوليدي.
حماية البيانات في كل خطوة
تحمل البيانات غير المهيكلة، مثل ملفات "PDF" والفيديو والملفات الصوتية، كمًا هائلًا من المعلومات القيمة التي يمكن أن تستفيد منها نماذج الذكاء الاصطناعي التوليدي. ومع ذلك، فإن التعامل مع هذه البيانات يثير تحديات أمنية كبيرة، مما يستدعي وجود إجراءات قوية لحماية البيانات. في هذا السياق، قد لا تكون أدوات التحكم في الوصول التقليدية كافية. ولذلك، يجب تحويل البيانات غير المهيكلة إلى صيغة يمكن لتطبيقات الذكاء الاصطناعي التوليدي تحليلها. من خلال هذا التحليل، يمكن فهم السياق المحيط بهذه البيانات، ومن ثم توليد بيانات وصفية تساعد في تحديد حقوق الوصول وضمان أمان البيانات.
لتقليل المخاطر الأمنية، يتجه بعض قادة البيانات والذكاء الاصطناعي إلى تصميم خطوط بيانات مكونة من وحدات صغيرة تتميز بقدرتها على تأمين البيانات تلقائيًا. على سبيل المثال، عند استخراج جدول الإيرادات الذي يتضمن ملاحظات موزعة على عدة صفحات في ملف "PDF"، يتطلب الأمر تطبيق نظام تحكم في الوصول يعتمد على الأدوار، بحيث يتم إخفاء الجمل ذات الصلة في النص. ولأن مخرجات الذكاء الاصطناعي التوليدي قد تكون غير متناسقة في كثير من الأحيان، يجب على قادة البيانات والذكاء الاصطناعي بناء أنظمة تحكم في الوصول وضمانات أمان متسقة عند كل نقطة مراجعة في خط البيانات. تبدأ هذه النقاط من مرحلة إدخال البيانات، مرورًا بمرحلة توجيه البيانات، واسترجاع البيانات المعزز، وصولًا إلى استهلاك البيانات بواسطة نماذج الذكاء الاصطناعي التوليدي.
دمج أفضل ممارسات كتابة الأكواد في نتائج الذكاء الاصطناعي التوليدي
من العناصر الأساسية لتحقيق التوسع هو ضمان الالتزام المتسق بالمعايير والممارسات المثلى المعتمدة عند هندسة البيانات. يمكن أن تكون المسألة معقدة عند استخدام الأكواد المولدة بواسطة النماذج اللغوية الكبيرة حيث قد تكون الجودة غير ملبية للتوقعات. يحدث هذا، على سبيل المثال، عندما تفتقر الأكواد إلى التنظيم أو لا تتناسب مع الأطُر المعيارية التي تعتمدها المؤسسة. وللتغلب على هذه المشاكل وتحسين جودة البيانات، تقوم بعض المؤسسات بدمج أفضل ممارسات البرمجة في جميع الأكواد التي يتم توليدها بواسطة الذكاء الاصطناعي التوليدي.
هناك نهج آخر لتحسين جودة البيانات هو استخدام الذكاء الاصطناعي التوليدي لتحليل قيم الأعمدة وتحديد القواعد المناسبة لجودة البيانات بناءً على القواعد الحالية، ثم دمجها بسلاسة في عملية إنشاء خطوط البيانات. عمومًا، تمتلك الشركات مجموعة معروفة من قواعد جودة البيانات لمنتجات البيانات الخاصة بها، وغالبًا ما تتطلب تعديلات طفيفة فقط لتناسب حالات الاستخدام المختلفة. عندما تقوم الشركات بتحديد هذه القواعد بشكل دقيق، مع ضبط المعايير الصحيحة لتلائم المواقف المختلفة، يمكنها تطوير حلول ذكاء اصطناعي توليدي تتيح لها إضافة هذه القواعد تلقائيًا إلى خطوط البيانات الخاصة بها. فمن خلال هذا النهج، يمكن للشركات ضمان أن عملياتها تلتزم دائمًا بأفضل ممارسات جودة البيانات، مما يحسن من دقة وكفاءة نتائجها.
هناك أدوات ذكاء اصطناعي توليدي متوافرة تعمل على الإسراع من وتيرة تطوير منتجات البيانات ومنصات البيانات وتحسين أدائها. ومع ذلك، لاستخدام هذه الأدوات بفعالية، يجب على الشركات مواجهة مجموعة واسعة من التحديات التقنية. فمن خلال التركيز على تحسين قدرات التنسيق، وأتمتة برامج تطوير البيانات، وتحسين سهولة الاستخدام، يمكن لقادة البيانات والذكاء الاصطناعي مساعدة مؤسساتهم على الانتقال من مرحلة التجارب الأولية للذكاء الاصطناعي التوليدي إلى توسيع الحلول التي تحقق قيمة حقيقية.