📝 Poëzie ontsnapping uit de gevangenis dwazen LLM veiligheidsfilters
Onderzoekers schreven 20 gedichten met verborgen verwijzingen naar schadelijke inhoud en testten deze op 25 modellen van negen grote bedrijven. Verrassend effectief.
Ze stellen dat de onvoorspelbaarheid van poëzie de op trefwoorden gebaseerde beveiligingsmechanismen omzeilt en dat sommige modellen in 70 tot 100 procent van de valkuilen trapten. Anthropic reageerde; anderen bleven stil… ongemakkelijk.
🔗 Lees meer
💸 Databricks streeft naar $5 miljard met een duizelingwekkende waardering van $134 miljard.
Volgens The Information is Databricks in gesprek om nieuw kapitaal op te halen tegen een bedrag dat ongeveer 32 keer de verwachte omzet van $4,1 miljard voor dit jaar bedraagt. Een groot bedrag, dus ook grote verwachtingen.
De marges zouden zijn gedaald tot 74 procent door de sterke toename in het gebruik van AI - een gevolg van de groei, of een waarschuwingssignaal? Reuters kon dit niet bevestigen en Databricks gaf geen commentaar.
🔗 Lees meer
🏭 Duitsland werkt aan een AI-gigafabriek.
Deutsche Telekom en Schwarz Group werken aan een project voor een AI-datacenter, meldt Handelsblatt, met het oog op EU-subsidie voor grootschalige computerkracht.
De gesprekken zijn al ver gevorderd, maar er is nog geen formele overeenkomst. Het idee is om de eigen AI-capaciteit van Europa te versterken, zodat het land niet langer afhankelijk is van GPU's uit het buitenland.
🔗 Lees meer
⚠️ Psychologen signaleren risicovol ChatGPT-5-gedrag in crisischats
Britse artsen hebben ernstige aandoeningen nagespeeld en zeggen dat de gratis chatbot soms waanideeën bevestigde of waarschuwingssignalen over het hoofd zag. Oei.
OpenAI zegt dat het gevoelige gesprekken doorverwijst naar veiligere modellen, subtiele hints geeft en controlemechanismen toevoegt - vooruitgang, zeker, maar geen vervanging voor een therapeut... bij lange na niet.
🔗 Lees meer
🎂 ChatGPT wordt drie jaar - nog steeds de hoofdpersoon
Van een voorproefje van onderzoek tot een cultuurveranderende ontwikkeling. TechCrunch brengt de rimpelende effecten in kaart, van marktdrama tot de eindeloze discussies over de vraag of dit een zeepbel is.
Het is surrealistisch, de app is overal, de metaforen zijn krakkemikkig en op de een of andere manier leven we allemaal in de wereld die er mede door is vormgegeven... of zo lijkt het tenminste.
🔗 Lees meer