الائتمان: VentureBeat مصنوع من Midjourney
انضم إلى النشرات الإخبارية اليومية والأسبوعية للحصول على أحدث التحديثات والمحتوى الحصري على تغطية الذكاء الاصطناعى الرائدة في الصناعة.”https://venturebeat.com/newsletters/?utm_source=VBsite&utm_medium=desktopNav” نوع البيانات=”link” معرف البيانات=”https://venturebeat.com/newsletters/?utm_source=VBsite&utm_medium=desktopNav”> تعرف على المزيد
وكلاء الذكاء الاصطناعى هم كل الغضب ، ولكن ماذا عن واحد يركز بشكل خاص على تحليل وفرز ورسم الاستنتاجات من مجلدات واسعة من البيانات؟
جوجل”https://developers.googleblog.com/en/data-science-agent-in-colab-with-gemini/” الهدف=”_blank” rel=”noreferrer noopener”> وكيل علم البيانات هل هذا فقط: مساعد Gemini 2.0 الجديد الذي يعمل من الذكاء الاصطناعى والذي يعمل على أتمتة تحليل البيانات متاح الآن للمستخدمين الذين تتراوح أعمارهم بين 18 عامًا في البلدان واللغات المحددة مجانًا.
المساعد متاح من خلال Google Colab ، خدمة الشركة التي يبلغ عمرها ثماني سنوات لتشغيل Python Code Live Online على قمة وحدات معالجة الرسومات (GPU) المملوكة لشركة Search Giant ومواقعها الداخلية الخاصة بها”https://venturebeat.com/ai/google-claims-its-new-tpus-are-2-7-times-faster-than-the-previous-generation/”> وحدات معالجة الموتر (TPUS).
تم إطلاقه في البداية للمختبرين الموثوق بهم في ديسمبر 2024 ، تم تصميم وكيل علوم البيانات لمساعدة الباحثين وعلماء البيانات والمطورين على تبسيط سير عملهم من خلال توليد دفاتر Jupyter بالكامل من أوصاف اللغة الطبيعية ، وكل ذلك في متصفح المستخدم.
يتماشى هذا التوسع مع جهود Google المستمرة لدمج ميزات الترميز وعلوم البيانات التي تحركها AI في كولاب ، والبناء على التحديثات السابقة مثل مساعدة ترميز الذكاء الاصطناعي التي تعمل بالدوام ، والتي تم الإعلان عنها في”https://blog.google/technology/developers/google-colab-ai-coding-features/” الهدف=”_blank” rel=”noreferrer noopener”> مايو 2023.
كما أنه يعمل كنوع من rejoinder المتقدم والمتأخر إلى Openai’s”https://mitsloanedtech.mit.edu/ai/tools/data-analysis/how-to-use-chatgpts-advanced-data-analysis-feature/” الهدف=”_blank” rel=”noreferrer noopener”> تحليل البيانات المتقدمة ChatGPT (سابقًا”https://venturebeat.com/ai/code-interpreter-comes-to-all-chatgpt-plus-users-anyone-can-be-a-data-analyst-now/” الهدف=”_blank” rel=”noreferrer noopener”> رمز مترجم) ، والتي تم دمجها الآن في ChatGpt عند تشغيل GPT-4.
ما هو Google Colab؟
Google Colab (اختصار لـ Colaboratory) هي بيئة دفتر Jupyter المستندة إلى مجموعة النظر التي تمكن المستخدمين من كتابة وتنفيذ رمز Python مباشرة في متصفحهم.
Jupyter Notebook هو تطبيق ويب مفتوح المصدر يمكّن المستخدمين من إنشاء ومشاركة المستندات التي تحتوي على التعليمات البرمجية المباشرة والمعادلات والتصورات والنص السردي. نشأت من مشروع Ipython في عام 2014 ، وهي تدعم الآن أكثر من 40 لغة برمجة ، بما في ذلك Python و R و Julia. يتم استخدام هذه المنصة التفاعلية على نطاق واسع في علوم البيانات والبحث والتعليم للمهام مثل تحليل البيانات وتصور مفاهيم البرمجة.
منذ إطلاقه في عام 2017 ، أصبحت Google Colab واحدة من أكثر المنصات استخدامًا على نطاق واسع للتعلم الآلي (ML) العلوم والتعليم.
بصفته Ori Abramovsky ، يتصدر علوم البيانات في Spectralops.io ، مفصلة في”https://medium.com/towards-artificial-intelligence/3-years-of-google-colab-usage-the-good-the-bad-and-the-ugly-e03ee4b7c92c” الهدف=”_blank” rel=”noreferrer noopener”> وظيفة متوسطة ممتازة منذ عام 2023 ، تجعل سهولة استخدام كولاب والوصول المجاني إلى وحدات معالجة الرسومات و TPUS خيارًا بارزًا للعديد من المطورين والباحثين.
وأشار إلى أن الحاجز المنخفض أمام الدخول ، والتكامل السلس مع Google Drive ودعم TPUS سمح فريقه بتقصير دورات التدريب بشكل كبير أثناء العمل على نماذج الذكاء الاصطناعى.
ومع ذلك ، أشار أبراموفسكي أيضًا إلى قيود كولاب ، مثل:
- حدود وقت الجلسة (خاصة للمستخدمين من الدرجة الحرة).
- تخصيص الموارد لا يمكن التنبؤ بها في أوقات الاستخدام الذروة.
- عدم وجود ميزات حرجة، مثل تنفيذ خط الأنابيب الفعال والجدولة المتقدمة.
- التحديات الدعم، حيث توفر Google خيارات محدودة للمساعدة المباشرة.
على الرغم من هذه العيوب ، شدد أبراموفسكي على أن كولاب لا يزال أحد أفضل حلول دفاتر الملاحظات غير المتوفرة – خاصة في المراحل المبكرة من مشاريع تحليل البيانات ML ومشاريع البيانات.
تبسيط تحليل البيانات مع الذكاء الاصطناعي
يبني وكيل علم البيانات على بيئة دفتر كولاب الخادم من خلال القضاء على الحاجة إلى الإعداد اليدوي.
باستخدام Google Gemini AI ، يمكن للمستخدمين وصف أهدافهم التحليلية باللغة الإنجليزية البسيطة (“تصور الاتجاهات ،” “تدريب نموذج التنبؤ ،” “القيم المفقودة النظيفة”) ، ويولد الوكيل دفاتر كولاب قابلة للتنفيذ بالكامل استجابةً.
يدعم المستخدمين من خلال:
- أتمتة التحليل: يولد دفاتر ملاحظات عمل كاملة بدلاً من قصاصات التعليمات البرمجية المعزولة.
- توفير الوقت: يلغي الإعداد اليدوي والترميز المتكرر.
- تعزيز التعاون: ميزات ميزات المشاركة المدمجة للمشاريع الجماعية.
- تقديم حلول قابلة للتعديل: يمكن للمستخدمين ضبط وتخصيص رمز تم إنشاؤه.
وكيل علوم البيانات يسارع بالفعل البحث العلمي في العالم الحقيقي
وفقًا لـ Google ، أبلغت المختبرين الأوائل عن توفير زمني كبير عند استخدام وكيل علوم البيانات.
على سبيل المثال ، قدّر عالم في مختبر لورنس بيركلي الوطني الذي يعمل على انبعاثات الميثان في الأراضي الرطبة الاستوائية أن وقت معالجة البيانات قد انخفض من أسبوع واحد إلى خمس دقائق فقط عند استخدام الوكيل.
أدت الأداة أيضًا بشكل جيد في معايير الصناعة ، حيث احتلت المرتبة الرابعة على”https://huggingface.co/spaces/adyen/DABstep” الهدف=”_blank” rel=”noreferrer noopener”> dabstep: معيار وكيل البيانات للتفكير متعدد الخطوات على وجه المعانقة، قبل عوامل الذكاء الاصطناعى مثل React (GPT-4.0) ، Deepseek ، Claude 3.5 Haiku و Llama 3.3 70b.
ومع ذلك ، فإن نماذج Openai منافسة O3-Mini و O1 ، بالإضافة إلى كلود 3.5 Sonnet من الإنسان ، فاقت كلاهما وكيل علم بيانات الجوزاء الجديد.
البدء
يمكن للمستخدمين البدء في استخدام وكيل علم البيانات في Google Colab باتباع هذه الخطوات:
- افتح دفتر كولاب جديد.
- تحميل مجموعة بيانات (CSV ، JSON ، إلخ).
- صف التحليل باللغة الطبيعية باستخدام لوحة الجوزاء الجانبية.
- تنفيذ دفتر الملاحظات الذي تم إنشاؤه لرؤية رؤى وتصورات.
توفر Google عينة من مجموعات البيانات والأفكار السريعة لمساعدة المستخدمين على استكشاف قدراته ، بما في ذلك:
- مسح المطورين Overflow: “تصور لغات البرمجة الأكثر شعبية.”
- مجموعة بيانات الأنواع القزحية: “حساب وتصور بيرسون وسبيرمان وكيندال الارتباطات.”
- مجموعة بيانات التصنيف الزجاجي: “تدريب مصنف الغابات العشوائي.”
في أي وقت يريد المستخدم استخدام الوكيل الجديد ، سيتعين عليهم الانتقال إلى كولاب والنقر فوق “ملف” ، ثم “دفتر ملاحظات جديد في محرك الأقراص” ، وسيتم تخزين دفتر الملاحظات الناتج في حساب Google Drive Cloud الخاص بهم.
كان استخدامي التجريبي الموجز أكثر مختلطًا
منحت ، أنا صحفي تقني متواضع وليس عالم بيانات ، ولكن استخدامي الخاص لوكيل علم البيانات الجديد الجوزاء 2.0 في كولاب حتى الآن كان أقل سلاسة.
لقد قمت بتحميل خمسة ملفات CSV (قيم مفصولة فاصلة وملفات جدول البيانات القياسية من Excel أو Sheets) وطلبتها “كم أنفق كل شهر وربع على مرافقاتي؟”.
المضي قدمًا وأدى العمليات التالية:
- مجموعات البيانات المدمجة، معالجة تاريخ وتفاوتات رقم الحساب.
- تم ترشيحه وتنظيف البيانات، ضمان المصروفات ذات الصلة فقط.
- المعاملات المجمعة في الشهر والربع لحساب الإنفاق.
- تصورات ولدت، مثل مخططات الخط لتحليل الاتجاه.
- النتائج الملخصة في تقرير واضح ومنظم.
قبل التنفيذ ، دفع كولاب رسالة تأكيد ، لتذكيرني بأنها قد تتفاعل مع واجهات برمجة التطبيقات الخارجية.
لقد فعل كل هذا بسرعة كبيرة وسلاسة في المتصفح ، في غضون ثوان. وكان من المثير للإعجاب مشاهدتها تعمل من خلال التحليل والبرمجة مع أوصاف مرئية خطوة بخطوة لما كانت تفعله.
ومع ذلك ، فإنه قد أدى في النهاية إلى إنشاء رسم بياني غير دقيق يوضح إنفاق فائدة لمدة شهر واحد فقط ، وفشل في التعرف على الأوراق ، وشملت قيمة سنة كاملة تم كسرها منذ شهور. عندما طلبت ذلك للمراجعة ، حاولت بشكل رائع ، ولكن في النهاية لم تستطع إنتاج سلسلة التعليمات البرمجية الصحيحة للإجابة على مطالبي.
لقد حاولت من نقطة الصفر نفس موجه بالضبط على دفتر جديد في Google Colab ، وأنتجت نتيجة أفضل بكثير ، لكنها لا تزال غريبة.
سأضطر إلى محاولة استكشاف الأخطاء وإصلاحها في بعضها البعض ، وكما قلت ، قد تكون النتيجة الخاطئة الأولية بسبب نقص الخبرة في استخدام أدوات علوم البيانات.
تسعير كولاب وميزات الذكاء الاصطناعى
على الرغم من أن Google Colab لا يزال مجانيًا ، يمكن للمستخدمين الذين يحتاجون إلى طاقة حسابية إضافية الترقية إلى الخطط المدفوعة:
- كولاب برو (9.99 دولار/شهر): 100 وحدة حساب ، وحدات معالجة الرسومات الأسرع ، والمزيد من الذاكرة ، والوصول الطرفي.
- كولاب برو+ (49.99 دولار/شهر): 500 وحدة حساب ، ترقيات GPU ذات الأولوية ، تنفيذ الخلفية.
- Colab Enterprise: Google Cloud Integration ، Generation Code-Code.
- الدفع كـ you-go: 9.99 دولارًا لـ 100 وحدة حسابية ، 49.99 دولارًا لـ 500 وحدة حسابية.
بالإضافة إلى وكيل علوم البيانات ، تقوم Google بتوسيع قدرات الذكاء الاصطناعي داخل كولاب.
تقوم Google بجمع المطالبات ، والرمز الذي تم إنشاؤه وتعليقات المستخدمين لتحسين نماذج الذكاء الاصطناعى. بينما يتم تخزين البيانات لمدة تصل إلى 18 شهرًا ، إلا أنها مجهولة ، وقد لا يتم الوفاء بطلبات الحذف دائمًا. يُنصح المستخدمون بعدم تقديم معلومات حساسة أو شخصية ، حيث قد يقوم المراجعون البشر بمعالجة المطالبات. بالإضافة إلى ذلك ، يجب مراجعة التعليمات البرمجية التي تم إنشاؤها من الذكاء الاصطناعى بعناية ، حيث قد تحتوي على عدم الدقة.
ردود الفعل مرحبًا
تشجع Google المستخدمين على تقديم ملاحظات من خلال مجتمع Discord Google Labs في قناة #-Dative-Ogent #.
مع أن الأتمتة التي تحركها الذكاء الاصطناعي أصبحت اتجاهًا رئيسيًا في علوم البيانات ، يمكن أن يساعد وكيل علوم البيانات في Google في كولاب الباحثين والمطورين على التركيز أكثر على الأفكار وأقل على إعداد الترميز. مع توسيع الأداة إلى المزيد من المستخدمين والمناطق ، سيكون من المثير للاهتمام أن نرى كيف تشكل مستقبل التحليلات المدعومة من AI.
الرؤى اليومية حول حالات استخدام الأعمال مع VB يوميا
إذا كنت ترغب في إقناع رئيسك في العمل ، فقد غطيت VB Daily. نمنحك السبق الصحفي الداخلي على ما تفعله الشركات مع الذكاء الاصطناعي التوليدي ، من التحولات التنظيمية إلى عمليات النشر العملية ، حتى تتمكن من مشاركة رؤى لأقصى عائد على الاستثمار.
اقرأ لدينا”http://venturebeat.com/terms-of-service/”> سياسة الخصوصية
شكرا على الاشتراك. تحقق أكثر”http://venturebeat.com/newsletters/”> النشرات الإخبارية VB هنا.
حدث خطأ.