منذ ظهور ماجستير إدارة الأعمال (LLM) على الساحة، كانت إحدى حالات الاستخدام/العرض التوضيحي الأولى هي تحليل البيانات. في هذه المرحلة، استخدم معظمنا ChatGPT أو Claude أو بعض أنظمة الذكاء الاصطناعي الأخرى لإنشاء مخطط، ولكن يبدو أن هيئة المحلفين ما زالت غير متأكدة من الدور الذي سيلعبه الذكاء الاصطناعي في تصور البيانات. هل سنستمر في الوضع الافتراضي للإشارة والنقر على الرسم البياني؟ هل سينتج الذكاء الاصطناعي 100% من الرسوم البيانية؟ أم أن المستقبل هجين، يخلط بين بعض أجيال الذكاء الاصطناعي وبعض النقاط والنقرات؟
كمؤسس في مجال الذكاء الاصطناعي وتصور البيانات، أجد هذا الموضوع شبه وجودي. تأسست بعد عام 2022 (أي بعد ظهور LLMs على الساحة بطريقة حقيقية)، يتعين علينا اتخاذ قرار بشأن الطريقة التي نريد بها التعامل مع الرسوم البيانية. هل نستثمر ساعات وساعات من العمل التطويري (والأموال) لتطوير وظائف الرسوم البيانية، أم أن ذلك سيختفي ويشكل تكلفة باهظة لجميع الأدوات التي تم إنشاؤها قبل دورات LLM؟ أم أن المستقبل هجين؟ لقد صادفت مؤخرًا Data Formulator، وهو مشروع بحثي، يستكشف بعض التفاعلات المثيرة للاهتمام حقًا بين الذكاء الاصطناعي والرسوم البيانية التقليدية والتي أعادت إحياء هذا السؤال بالنسبة لي.
في هذا المنشور، سألقي نظرة على ما وصلنا إليه اليوم فيما يتعلق بتحويل النص إلى مخطط (أو تحويل النص إلى تصور) وإلى أين يمكن أن نتجه في المستقبل.
مثل كل ما يتعلق بالذكاء الاصطناعي، من المحتمل ألا يتقدم هذا المنشور بشكل جيد. ستظهر بعض المعلومات أو النماذج الجديدة خلال الأشهر الستة المقبلة وستغير طريقة تفكيرنا حول هذا الموضوع تمامًا. ومع ذلك، دعونا نلقي نظرة على الحالات المختلفة لتصور البيانات والذكاء الاصطناعي.
لن أطيل الحديث عن هذا كثيرًا نظرًا لأن معظم القراء يعرفون هذا جيدًا. افتح Excel أو Google Sheets أو أي أداة بيانات أخرى تم إنشاؤها قبل عام 2023 وسيكون لديك شكل من أشكال ذلك. في بعض الأحيان تقوم بالنقر لإضافة بيانات إلى محور، وأحيانًا تقوم بسحب وإسقاط حقل، ولكن المفهوم هو نفسه: تقوم ببناء البيانات بشكل مناسب، ثم تضغط على بعض الأزرار لإنشاء مخطط.
في هذا النموذج، تتم الغالبية العظمى من عمليات تنظيف البيانات وتحويلها قبل الرسم البياني. يمكنك بشكل عام تطبيق مقاييس التجميع مثل المتوسط، والوسيط، والعدد، والحد الأدنى، والحد الأقصى وما إلى ذلك. ولكن جميع التحويلات بدائية إلى حد ما.
الرسوم البيانية التي تم إنشاؤها بواسطة الذكاء الاصطناعي، أو تحويل النص إلى تصور، كانت موجودة بالفعل فقط منذ ظهور ماجستير إدارة الأعمال الحديث (إذا بحثنا، كانت هناك تجارب جارية قبل ذلك، ولكن لجميع الأغراض العملية يمكننا التركيز على ما بعد عام 2022) ماجستير).
يمكن لـ ChatGPT الخاص بـ OpenAI إنشاء مخططات غير تفاعلية باستخدام Python، أو مجموعة محدودة من المخططات التفاعلية باستخدام مكتبات الواجهة الأمامية (راجع OpenAI Canvas لبعض الأمثلة). كما هو الحال مع كل ما يتعلق بـ OpenAI، فإن الأنثروبيك لديها مفاهيمها المماثلة ولها المصنوعات اليدوية.
من الجدير بالذكر هنا أن المخططات التي تم إنشاؤها بواسطة الذكاء الاصطناعي يمكن تقسيمها إلى عائلتين: المخططات المولدة من نوع Pythonic/الخلفية أو مزيج من الواجهة الخلفية والواجهة الأمامية.
يتناوب ChatGPT وClaude بين الاثنين. يمكن أن يكون تدريب الذكاء الاصطناعي لإنشاء كود الواجهة الأمامية، ودمج كود الواجهة الأمامية لإنشاء تصورات، عملاً أكثر بكثير من مجرد الاعتماد على Python، وذلك باستخدام مكتبة مثل Plotly، وmatplotlib، وseaborn. من ناحية أخرى، تمنح مكتبات الواجهة الأمامية مقدمي الخدمات والمستخدمين مزيدًا من التحكم في شكل ومظهر المخطط والتفاعل. هذا هو السبب وراء قيام موفري LLM بجعل الذكاء الاصطناعي الخاص بهم ينشئ مخططات أساسية مثل المخططات الشريطية أو المخططات الخطية أو المخططات المبعثرة، ولكن أي شيء أكثر تعقيدًا مثل مخطط Sankey أو المخطط الشلالي يعود إلى Python.
شريط جانبي مختصر على Fabi.ai: نظرًا لأننا منصة لتحليل البيانات، فمن الواضح أننا نقدم الرسوم البيانية، وعلى الرغم من بعض الرسوم البيانية التي تعتمد على التوجيه والنقر، فإن الغالبية العظمى من الرسوم البيانية التي أنشأها مستخدمونا تم إنشاؤها بواسطة الذكاء الاصطناعي. حتى الآن، وجدنا أن الذكاء الاصطناعي جيد بشكل ملحوظ في إنشاء الرسوم البيانية، ومن خلال الاستفادة من لغة بايثون النقية في الرسوم البيانية، تمكنا من تدريب الذكاء الاصطناعي لإنشاء أي مخطط يمكن للمستخدم أن يحلم به تقريبًا. لقد اخترنا حتى الآن الدقة والمرونة بدلاً من وظيفة الإشارة والنقر وتصميمات واجهة المستخدم المخصصة.
هجين: إنشاء الذكاء الاصطناعي في نموذج الإشارة والنقر
هذا هو المكان الذي تبدأ فيه الأمور في إثارة الاهتمام في النقاش الدائر حول الاتجاه الذي يتجه إليه تحويل النص إلى تصور باستخدام الذكاء الاصطناعي. بعد مرور 3 سنوات من الآن، عندما يقوم شخص ما بإجراء تحليل، إذا استخدم الذكاء الاصطناعي، فهل سيسمح للذكاء الاصطناعي بالتحكم بنسبة 100٪، أم سيتم استخدام الذكاء الاصطناعي في بيئة مختلطة حيث يمكنه فقط تحرير المخططات ضمن حدود بعض وظائف الإشارة والنقر.
للمساعدة في جعل هذه الصورة أكثر واقعية، راجع أداة صياغة البيانات. هذا مشروع بحثي حديث يحاول تقديم بيئة مختلطة حقيقية حيث يمكن للذكاء الاصطناعي إجراء تعديلات معينة، ولكن يمكن للمستخدم تولي وظيفة الإشارة والنقر واستخدامها حسب الحاجة.
إذا طرحنا السؤال باستخدام تشبيه السيارة: هل تعتقد أنه في المستقبل لن يكون للسيارات عجلة قيادة، أو هل تعتقد أنه سيكون هناك سائق سيتعين عليه الجلوس هناك والانتباه وأحيانًا أخذ هل انتهى الأمر، على غرار الطريقة التي تعمل بها وظيفة القيادة الذاتية في Tesla حاليًا؟
يعد السؤال حول أين تتجه الأمور أمرًا مهمًا حقًا بالنسبة لنا في Fabi.ai نظرًا لأن هذا يمكن أن يؤثر بشكل كبير على بعض القرارات التي نتخذها: هل نستثمر في دمج مكتبة الرسوم البيانية في الواجهة الأمامية؟ هل نهتم بوظيفة الإشارة والنقر على الإطلاق؟ باعتبارنا شركة متنامية ومبتكرة رائدة في مجال تحليل بيانات الذكاء الاصطناعي، نحتاج إلى التفكير في الاتجاه الذي تتجه إليه الكرة، وليس في مكانها الحالي.
لذا للإجابة على هذا السؤال، سأستخدم بعض التفكير المبدئي.
منذ المرة الأولى التي استخدمت فيها الذكاء الاصطناعي وظهرت شكاوى حول السرعة والتكلفة، اعتقدت أن الذكاء الاصطناعي سيستمر في التحسن والأسرع والأرخص. بشكل تقريبي، انخفضت تكلفة الرمز المميز بنسبة 87٪ سنويًا في السنوات القليلة الماضية. لم تنخفض التكلفة فحسب، بل ارتفعت الدقة والسرعة بشكل كبير أيضًا.
في السنوات العشر القادمة، سوف ننظر إلى الوراء في 2024 LLMs بنفس الطريقة التي ننظر بها إلى "أجهزة الكمبيوتر العملاقة" من الثمانينيات والتسعينيات الآن بعد أن أصبح لدينا جميعًا أجهزة كمبيوتر فائقة في جيوبنا في كل مكان نذهب إليه.
كل هذا يعني أن أي حجة مؤيدة أو ضد أي من أساليب الرسوم البيانية المختلفة المذكورة أعلاه لا يمكن أن تكون أن الذكاء الاصطناعي بطيء جدًا أو مكلف أو غير دقيق لإنشاء الرسوم البيانية. بمعنى آخر، للاعتقاد بأن الرسم البياني بالإشارة والنقر سيظل موجودًا بأي شكل من الأشكال أو الشكل أو الشكل، عليك أن تصدق أن هناك شيئًا ما حول تجربة المستخدم أو حالة الاستخدام، يستحق هذه الوظيفة.
في تجربتي، عند القيام بأي شكل من أشكال تحليل البيانات التي تتضمن التصور، فإن الجزء الصعب ليس الرسم البياني. الجزء الصعب هو تنظيف البيانات وتجهيزها بالتنسيق الصحيح للمخطط الذي أحاول إنشاءه.
أقول بعض بيانات حدث المستخدم التي تحتوي على الحقول التالية:
لنفترض الآن أنني أريد رسم متوسط مدة الحدث بالساعة لقياس زمن الاستجابة. قبل أن أتمكن من القيام بأي نوع من الرسوم البيانية في جدول بيانات أو أداة رسوم بيانية قديمة، لا بد لي من:
ولكن عندما تطلب من الذكاء الاصطناعي القيام بذلك، فإنه يعتني بكل ذلك والرسوم البيانية في ثانية أو ثانيتين فقط:
# Calculate the event duration in hours df['Event duration (hours)'] = (df['Event end datetime'] - df['Event start datetime']).dt.total_seconds() / 3600 # Extract the start hour from the start datetime df['Start hour'] = df['Event start datetime'].dt.hour # Group by start hour and calculate the average duration average_duration_by_hour = df.groupby('Start hour')['Event duration (hours)'].mean().reset_index() # Plot using Plotly fig = px.bar( average_duration_by_hour, x='Start hour', y='Event duration (hours)', title='Average Event Duration by Hour', labels={'Event duration (hours)': 'Average Duration (hours)', 'Start hour': 'Hour of Day'}, text='Event duration (hours)' ) # Show the figure fig.show()
وكان هذا أحد أبسط الأمثلة الممكنة. في أغلب الأحيان تكون بيانات العالم الحقيقي أكثر تعقيدًا.
في هذه المرحلة، من المحتمل أن يكون لديك إحساس بالمكان الذي أميل إليه. وطالما يمكنك الحصول على مجموعة البيانات الخاصة بك بشكل صحيح تقريبًا مع جميع البيانات اللازمة للتحليل، فإن الذكاء الاصطناعي يقوم بالفعل بعمل جيد بشكل ملحوظ في التعامل معها ورسمها في غمضة عين. وبعد مرور عام أو عامين أو ثلاثة أعوام من الآن، من الصعب أن نتخيل أن هذا لن يكون هو المعيار.
ومع ذلك، هناك بعض الأساليب الهجينة المثيرة للاهتمام التي تظهر مثل Data Formulator. السبب وراء هذا النوع من النهج هو أنه ربما تكون أيدينا وأدمغتنا قادرة على التحرك بشكل أسرع لإجراء التعديلات بسرعة مما يتطلب منا التفكير فيما نريده وشرحه بشكل واضح بما فيه الكفاية حتى يتمكن الذكاء الاصطناعي من القيام بعمله. إذا سألت "أرني إجمالي المبيعات حسب الشهر على مدار الـ 12 شهرًا الماضية" مع افتراض أن هذا يجب أن يكون مخططًا شريطيًا مكدسًا مقسمًا حسب المنطقة، فمن المحتمل أننا قد نجد أنه من الأسهل مجرد تحريك الماوس. إذا كان الأمر كذلك، فقد يكون النهج المختلط هو الأكثر إثارة للاهتمام: اطلب من الذكاء الاصطناعي أن يقوم بالمحاولة الأولى، ثم بضع نقرات وستحصل على ما تريد.
سيكون مفتاح النجاح لنهج الذكاء الاصطناعي الكامل أو النهج المختلط في تجربة المستخدم. بالنسبة للنهج المختلط، يجب أن تعمل التفاعلات بين الذكاء الاصطناعي والبشر بشكل مثالي جنبًا إلى جنب وأن تكون بديهية بشكل لا يصدق للمستخدم.
أنا متحمس لمشاهدة تطور المساحة والتوجه نحو تحويل النص إلى تصور خلال الأشهر الـ 12 المقبلة.
تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.
Copyright© 2022 湘ICP备2022001581号-3