يعد Reddit أحد أكبر المنتديات على الإنترنت. يزور الموقع حوالي 57 مليون شخص يوميًا لمناقشة مجموعة واسعة من المواضيع. في السنوات الأخيرة، أصبحت بيانات Reddit أيضًا أداة تدريب مجانية للذكاء الاصطناعي لشركة Google وOpenAI وMicrosoft. تستخدم هذه الشركات مناقشات المنتدى في تطوير أنظمة الذكاء الاصطناعي.
في 18 أبريل، أعلنت شركة Reddit عن خططها لبدء فرض رسوم على الشركات مقابل الوصول إلى واجهة برمجة التطبيقات (API). يؤكد ستيف هوفمان، مؤسس ومدير تنفيذي لشركة Reddit، أن "بيانات Reddit قيمة حقًا" ولا يمكن تقديمها مجانًا لأغنى الشركات في العالم .
تأسست شركة Reddit في عام 2005، وتجني الأموال بشكل أساسي من خلال الإعلانات ومعاملات التجارة الإلكترونية على المنصة. ولا يزال المنتدى في مرحلة وضع اللمسات الأخيرة على تفاصيل الرسوم، ومن المقرر أن يعلن عن الأسعار في الأسابيع المقبلة.
أصبحت المحادثات على Reddit وما شابهها سلعًا قيمة حيث تلعب نماذج اللغة الكبيرة (LLMs) دورًا أساسيًا في إنشاء تقنيات الذكاء الاصطناعي الجديدة. تعد LLMs خوارزميات متطورة تغذي البيانات من Reddit والتي يتم تطويرها فيها. تستخدم كل من خدمتي Google Bard أو ChatGPT بيانات Reddit.
يتمتع ChatGPT بالعديد من الفوائد للشركة التي تقف وراءه، ولكن لا يوجد أي فوائد لـ Reddit. في الواقع، يمكن استخدامه أيضًا لإنشاء منافسين لـ Reddit. وبدأت العديد من الشركات الأخرى أيضًا في بيع البيانات لمطوري الذكاء الاصطناعي. على سبيل المثال، قامت شركة Shutterstock ببيع بيانات الصور الخاصة بها إلى شركة OpenAI لتطوير برنامج Dall-E لتحويل النص إلى صورة.
وفي الأسبوع الماضي، قال إيلون ماسك إنه سيفرض قيودا صارمة على استخدام تويتر لواجهة برمجة التطبيقات الخاصة به، والتي تستخدمها آلاف الشركات والمطورين المستقلين لتتبع ملايين المحادثات على المنصة. يمكن أن تتراوح الرسوم من بضعة آلاف إلى عدة مئات الآلاف من الدولارات.
لكي يتحسن برنامج الماجستير في القانون بشكل مستمر، تحتاج الشركات إلى أمرين: قوة حوسبة هائلة وبيانات ضخمة. تتمتع بعض الشركات بالفعل بقوة حوسبة كبيرة ولكنها لا تزال تبحث عن بيانات خارجية لتحسين خوارزمياتها. وتشمل هذه المصادر مثل ويكيبيديا ، والكتب الإلكترونية، والمقالات الأكاديمية، أو ريديت.
ويعتقد هوفمان أن بياناتهم قيمة جزئيًا لأنها يتم تحديثها باستمرار. إن الحداثة والملاءمة هما ما تحتاج إليه نماذج اللغة الكبيرة لإنتاج أفضل النتائج. وقال إن واجهة برمجة التطبيقات الخاصة بـ Reddit تظل مجانية للمطورين الذين يريدون كتابة تطبيقات تخدم مجتمع Reddit أو العلماء الذين يريدون دراسة البيانات لأغراض أكاديمية أو غير تجارية.
وفقا لهوفمان، فإن الشركات التي تجمع البيانات، وتخلق القيمة، ولكنها لا تقدم أي شيء في المقابل لمستخدمي Reddit، هي المشكلة. لذا، فهذا هو الوقت المناسب لتشديد الأمور.
(وفقا لصحيفة نيويورك تايمز)
[إعلان 2]
مصدر
تعليق (0)