الائتمان: VentureBeat مصنوع من Midjourney
انضم إلى نشراتنا الإخبارية اليومية والأسبوعية للحصول على آخر التحديثات والمحتوى الحصري حول تغطية الذكاء الاصطناعي الرائدة في الصناعة.”https://venturebeat.com/newsletters/?utm_source=VBsite&utm_medium=desktopNav” نوع البيانات=”link” معرف البيانات=”https://venturebeat.com/newsletters/?utm_source=VBsite&utm_medium=desktopNav”> اعرف المزيد
ديفبوت، وهي شركة صغيرة في وادي السيليكون تشتهر باحتفاظها بواحد من أكبر المؤشرات في العالم”https://www.diffbot.com/products/knowledge-graph/”>الويب المعرفةأعلنت اليوم عن إطلاق نموذج جديد للذكاء الاصطناعي يعد بمعالجة أحد أكبر التحديات في هذا المجال: الدقة الواقعية.
ال”https://github.com/diffbot/diffbot-llm-inference”> نموذج جديد، نسخة مضبوطة من Meta’s LLama 3.3، وهي أول تطبيق مفتوح المصدر لنظام يُعرف باسم الجيل المعزز لاسترجاع الرسم البياني، أو”https://arxiv.org/abs/2501.00309″ الهدف=”_blank” rel=”noreferrer noopener”> الرسم البياني.
على عكس نماذج الذكاء الاصطناعي التقليدية، التي تعتمد فقط على كميات هائلة من بيانات التدريب المحملة مسبقًا،”https://github.com/diffbot/diffbot-llm-inference”> ديفبوت LLM يعتمد على المعلومات في الوقت الحقيقي من الشركة”https://www.diffbot.com/products/knowledge-graph/” الهدف=”_blank” rel=”noreferrer noopener”> المعرفة الرسم البياني، وهي قاعدة بيانات يتم تحديثها باستمرار وتحتوي على أكثر من تريليون حقيقة مترابطة.
قال مايك تونغ، المؤسس والرئيس التنفيذي لشركة Diffbot، في مقابلة مع VentureBeat: “لدينا أطروحة: أنه في نهاية المطاف سيتم استخلاص المنطق العام الأغراض إلى حوالي مليار معلمة”. “أنت لا تريد في الواقع المعرفة في النموذج. أنت تريد أن يكون النموذج جيدًا في استخدام الأدوات فقط حتى يتمكن من الاستعلام عن المعرفة خارجيًا.
كيف يعمل
ديفبوت”https://www.diffbot.com/products/knowledge-graph/”> الرسم البياني المعرفي هي قاعدة بيانات آلية مترامية الأطراف تقوم بالزحف إلى شبكة الويب العامة منذ عام 2016. وهي تصنف صفحات الويب إلى كيانات مثل الأشخاص والشركات والمنتجات والمقالات، وتستخرج المعلومات المنظمة باستخدام مزيج من رؤية الكمبيوتر ومعالجة اللغة الطبيعية.
كل أربعة إلى خمسة أيام، يتم تحديث الرسم البياني المعرفي بملايين الحقائق الجديدة، مما يضمن بقاءه محدثًا. ديفبوت”https://github.com/diffbot/diffbot-llm-inference” الهدف=”_blank” rel=”noreferrer noopener”> الذكاء الاصطناعي نموذج يستفيد هذا المورد من خلال الاستعلام عن الرسم البياني في الوقت الفعلي لاسترداد المعلومات، بدلاً من الاعتماد على المعرفة الثابتة المشفرة في بيانات التدريب الخاصة به.
على سبيل المثال، عند سؤال النموذج عن حدث إخباري حديث، يمكنه البحث في الويب عن آخر التحديثات، واستخراج الحقائق ذات الصلة، والاستشهاد بالمصادر الأصلية. تم تصميم هذه العملية لجعل النظام أكثر دقة وشفافية من LLMs التقليدية.
قال تونغ: “تخيل سؤال الذكاء الاصطناعي عن الطقس”. “بدلاً من توليد إجابة بناءً على بيانات التدريب القديمة، يقوم نموذجنا بالاستعلام عن خدمة الطقس الحية ويوفر استجابة ترتكز على معلومات في الوقت الفعلي.”
كيف يتفوق الرسم البياني المعرفي لـ Diffbot على الذكاء الاصطناعي التقليدي في العثور على الحقائق
وفي الاختبارات المعيارية، يبدو أن نهج ديفبوت يؤتي ثماره. أفادت الشركة أن نموذجها حقق درجة دقة تبلغ 81٪”https://github.com/freshllms/freshqa” الهدف=”_blank” rel=”noreferrer noopener”> فريش كيو ايه، وهو معيار أنشأته Google لاختبار المعرفة الواقعية في الوقت الفعلي، متجاوزًا كلاً من ChatGPT وGemini. كما حصل على نسبة 70.36%”https://arxiv.org/abs/2406.01574″ الهدف=”_blank” rel=”noreferrer noopener”>MMLU-برو، نسخة أكثر صعوبة من الاختبار القياسي للمعرفة الأكاديمية.
ولعل الأمر الأكثر أهمية هو أن Diffbot يجعل نموذجه مفتوح المصدر بالكامل، مما يسمح للشركات بتشغيله على أجهزتها الخاصة وتخصيصه ليناسب احتياجاتها. يعالج هذا المخاوف المتزايدة بشأن خصوصية البيانات وتقييد الموردين مع موفري الذكاء الاصطناعي الرئيسيين.
وأشار تونغ إلى أنه “يمكنك تشغيله محليًا على جهازك”. “لا توجد طريقة يمكنك من خلالها تشغيل Google Gemini دون إرسال بياناتك إلى Google وشحنها خارج مقر عملك.”
يمكن للذكاء الاصطناعي مفتوح المصدر أن يغير طريقة تعامل المؤسسات مع البيانات الحساسة
يأتي الإصدار في لحظة محورية في تطوير الذكاء الاصطناعي. شهدت الأشهر الأخيرة انتقادات متزايدة لميل نماذج اللغة الكبيرة إلى “”https://mitsloanedtech.mit.edu/ai/basics/addressing-ai-hallucinations-and-bias/”> هلوسة”أو توليد معلومات كاذبة، حتى مع استمرار الشركات في زيادة أحجام النماذج. يقترح نهج ديفبوت مسارًا بديلًا للمضي قدمًا، يركز على تأريض أنظمة الذكاء الاصطناعي بحقائق يمكن التحقق منها بدلاً من محاولة تشفير كل المعرفة البشرية في الشبكات العصبية.
وقال تونغ: “لا يسعى الجميع وراء نماذج أكبر وأكبر فقط”. “يمكن أن يكون لديك نموذج يتمتع بقدرة أكبر من النموذج الكبير مع نوع من النهج غير البديهي مثل نهجنا.”
يشير خبراء الصناعة إلى أن النهج القائم على الرسم البياني المعرفي لـ Diffbot يمكن أن يكون ذا قيمة خاصة لتطبيقات المؤسسات حيث تعد الدقة وقابلية التدقيق أمرًا بالغ الأهمية. وتقدم الشركة بالفعل خدمات البيانات للشركات الكبرى بما في ذلك”https://www.cisco.com/”> سيسكو,”https://duckduckgo.com/”> دك دك جو و”https://www.snapchat.com/”> سناب شات.
النموذج متاح على الفور من خلال إصدار مفتوح المصدر على”https://github.com/diffbot”> جيثب ويمكن اختباره من خلال عرض توضيحي عام في”https://diffy.chat”> ديفي.دردشة. بالنسبة للمؤسسات التي ترغب في نشرها داخليًا، يقول Diffbot إن الإصدار الأصغر الذي يحتوي على 8 مليارات معلمة يمكن تشغيله على جهاز واحد”https://www.nvidia.com/en-us/data-center/a100/”> نفيديا A100 GPU، في حين أن الإصدار الكامل الذي يحتوي على 70 مليار معلمة يتطلب اثنين”https://www.nvidia.com/en-us/data-center/h100/”> وحدات معالجة الرسومات H100.
وبالنظر إلى المستقبل، يعتقد تونغ أن مستقبل الذكاء الاصطناعي لا يكمن في نماذج متزايدة الضخامة، بل في طرق أفضل لتنظيم المعرفة البشرية والوصول إليها: “الحقائق أصبحت قديمة. سيتم نقل الكثير من هذه الحقائق إلى أماكن واضحة حيث يمكنك بالفعل تعديل المعرفة وحيث يمكنك الحصول على مصدر البيانات.
بينما تتصارع صناعة الذكاء الاصطناعي مع التحديات المتعلقة بالدقة الواقعية والشفافية، فإن إصدار Diffbot يقدم بديلاً مقنعًا للنموذج المهيمن الأكبر هو الأفضل. ويبقى أن نرى ما إذا كانت ستنجح في تغيير اتجاه المجال، لكنها أثبتت بالتأكيد أنه عندما يتعلق الأمر بالذكاء الاصطناعي، فإن الحجم ليس كل شيء.
رؤى يومية حول حالات استخدام الأعمال باستخدام VB Daily
إذا كنت ترغب في إثارة إعجاب رئيسك في العمل، فإن VB Daily يلبي احتياجاتك. نقدم لك السبق الصحفي الداخلي حول ما تفعله الشركات باستخدام الذكاء الاصطناعي التوليدي، بدءًا من التحولات التنظيمية وحتى عمليات النشر العملية، حتى تتمكن من مشاركة الرؤى لتحقيق أقصى عائد على الاستثمار.
اقرأ لدينا”http://venturebeat.com/terms-of-service/”>سياسة الخصوصية
شكرا للاشتراك. تحقق من المزيد”http://venturebeat.com/newsletters/”> النشرات الإخبارية VB هنا.
حدث خطأ.