Reddit เป็นหนึ่งในฟอรัมที่ใหญ่ที่สุดบนอินเทอร์เน็ต ผู้คนประมาณ 57 ล้านคนเข้าชมเว็บไซต์ทุกวันเพื่อพูดคุยในหัวข้อต่างๆ ในช่วงไม่กี่ปีที่ผ่านมาข้อมูล Reddit ได้กลายเป็นเครื่องมือการฝึกอบรม AI ฟรีสำหรับ Google, OpenAI และ Microsoft บริษัทเหล่านี้ใช้การอภิปรายทางฟอรั่มในการพัฒนาระบบ AI
ในวันที่ 18 เมษายน Reddit ได้ประกาศแผนที่จะเริ่มเรียกเก็บเงินจากบริษัทต่างๆ สำหรับการเข้าถึง API (อินเทอร์เฟซการเขียนโปรแกรมแอปพลิเคชัน) Steve Huffman ผู้ก่อตั้งและซีอีโอของ Reddit ยืนยันว่า “ข้อมูลของ Reddit มีค่าจริงๆ” และไม่สามารถแจกจ่ายให้กับบริษัทที่ร่ำรวยที่สุดในโลก ได้ฟรี
Reddit ก่อตั้งขึ้นในปี พ.ศ. 2548 โดยทำเงินเป็นหลักผ่านการโฆษณาและธุรกรรมอีคอมเมิร์ซบนแพลตฟอร์ม ฟอรัมยังคงสรุปรายละเอียดค่าธรรมเนียมอยู่ และจะประกาศราคาในอีกไม่กี่สัปดาห์ข้างหน้า
การสนทนาบน Reddit และอื่นๆ กลายเป็นสินค้าที่มีคุณค่าเนื่องจากโมเดลภาษาขนาดใหญ่ (LLM) มีบทบาทสำคัญในการสร้างเทคโนโลยี AI ใหม่ๆ LLM เป็นอัลกอริทึมที่ซับซ้อนซึ่งป้อนข้อมูลจาก Reddit ที่ใช้พัฒนา ทั้งบริการ Google Bard และ ChatGPT ต่างก็ใช้ข้อมูล Reddit
ChatGPT มีประโยชน์มากมายสำหรับบริษัทที่อยู่เบื้องหลัง แต่ไม่มีอะไรเลยสำหรับ Reddit ในความเป็นจริงมันสามารถใช้สร้างคู่แข่งของ Reddit ได้ด้วย บริษัทอื่นๆ อีกหลายแห่งก็เริ่มขายข้อมูลให้กับนักพัฒนา AI เช่นกัน ตัวอย่างเช่น Shutterstock ขายข้อมูลภาพให้กับ OpenAI เพื่อพัฒนาโปรแกรมแปลงข้อความเป็นภาพ Dall-E
สัปดาห์ที่แล้ว อีลอน มัสก์กล่าวว่าเขาจะเข้มงวดกับการใช้งาน API ของ Twitter ที่บริษัทและนักพัฒนาอิสระหลายพันแห่งใช้ติดตามการสนทนาหลายล้านรายการบนแพลตฟอร์ม ค่าธรรมเนียมอาจมีตั้งแต่ไม่กี่พันจนถึงหลายแสนดอลลาร์
หากต้องการให้ LLM ปรับปรุงอย่างต่อเนื่อง บริษัทต่างๆ ต้องมี 2 สิ่ง ได้แก่ พลังการประมวลผลมหาศาล และข้อมูลมหาศาล บริษัทบางแห่งมีพลังการประมวลผลขนาดใหญ่แล้วแต่ยังคงมองหาข้อมูลภายนอกเพื่อปรับปรุงอัลกอริทึมของตน ซึ่งรวมถึงแหล่งที่มา เช่น Wikipedia , หนังสืออิเล็กทรอนิกส์, บทความวิชาการ หรือ Reddit
ฮัฟแมนเชื่อว่าข้อมูลของพวกเขามีค่าเพราะมีการอัปเดตอย่างต่อเนื่อง ความสดใหม่และความเกี่ยวข้องคือสิ่งที่โมเดลภาษาขนาดใหญ่ต้องการเพื่อสร้างผลลัพธ์ที่ดีที่สุด API ของ Reddit ยังคงเปิดให้ใช้งานฟรีสำหรับนักพัฒนาที่ต้องการเขียนแอปพลิเคชันที่ให้บริการชุมชน Reddit หรือสำหรับนักวิชาการที่ต้องการศึกษาข้อมูลเพื่อวัตถุประสงค์ทางวิชาการหรือที่ไม่ใช่เชิงพาณิชย์ เขากล่าว
ตามที่ฮัฟแมนกล่าว บริษัทต่างๆ ที่รวบรวมข้อมูล สร้างมูลค่า แต่ไม่ได้มอบสิ่งใดๆ กลับคืนให้กับผู้ใช้ Reddit ถือเป็นปัญหา ดังนั้นนี่เป็นเวลาที่ดีที่จะทำให้สิ่งต่างๆ กระชับขึ้น
(ตามรายงานของนิวยอร์กไทมส์)
แหล่งที่มา
การแสดงความคิดเห็น (0)