OpenAI kondigde op 5 augustus voor het eerst sinds de lancering van GPT-2 in 2019 twee open gewogen taalmodellen aan.
Een model voor kunstmatige intelligentie wordt als open weging beschouwd als de parameters ervan, d.w.z. de factoren die bijdragen aan het verbeteren van de output en voorspellingen tijdens de training, openbaar beschikbaar zijn.
Open wegingsmodellen kunnen transparantie en controle bieden, maar ze verschillen van open source-modellen, waarbij de volledige broncode voor iedereen beschikbaar is om te gebruiken en aan te passen.
Volgens OpenAI zijn deze modellen met alleen tekst, genaamd gpt-oss-120b en gpt-oss-20b, ontworpen om ontwikkelaars, onderzoekers en bedrijven goedkopere opties te bieden die eenvoudig te bedienen en aan te passen zijn.
Beide nieuwe modellen van OpenAI kunnen geavanceerde inferentie, toolgebruik en neurale verwerkingstaken aan. Ze zijn ontworpen om overal te draaien, van consumentenhardware tot cloudplatforms en on-device applicaties.
Volgens OpenAI kunnen gebruikers gpt-oss-20b op een laptop uitvoeren en het gebruiken als een persoonlijke assistent die door bestanden kan zoeken en kan schrijven.
Het bedrijf werkt samen met Nvidia, Advanced Micro Devices (AMD), Cerebras en Groq om ervoor te zorgen dat deze modellen goed werken op verschillende chips.
Er werd met spanning uitgekeken naar de release van de open wegingsmodellen van OpenAI, deels omdat het bedrijf de lancering herhaaldelijk heeft uitgesteld omdat het meer tijd nodig had om aanvullende veiligheidstests uit te voeren en risicogebieden te beoordelen.
OpenAI meldde op 5 augustus dat het uitgebreide training en veiligheidstests had uitgevoerd op zijn opengewichtmodellen. Het bedrijf filterde schadelijke chemische, biologische, radiologische en nucleaire gegevens eruit tijdens de pre-training en simuleerde hoe kwaadwillenden de modellen zouden kunnen proberen te verfijnen voor kwaadaardige doeleinden.
OpenAI gaf ook aan dat het met drie onafhankelijke groepen experts heeft samengewerkt om feedback te krijgen op de beoordeling van dit kwaadaardige aanpassingsproces.
De afgelopen jaren hebben verschillende andere technologiebedrijven, zoals Meta, het door Microsoft gesteunde Mistral AI en de Chinese startup DeepSeek, ook open wegingsmodellen uitgebracht.
Bron: https://www.vietnamplus.vn/openai-lan-dau-phat-hanh-mo-hinh-ai-trong-so-mo-ke-tu-nam-2019-post1054037.vnp
Reactie (0)