Hoeveel water verbruikt AI?

Hoeveel water verbruikt AI?

Je hebt vast wel eens van alles gehoord, van "AI drinkt een fles water na elke paar vragen" tot "het zijn maar een paar druppels". De waarheid is echter genuanceerder. De watervoetafdruk van AI varieert sterk, afhankelijk van waar het draait, hoe lang je vraag duurt en hoe een datacenter zijn servers koelt. Dus ja, het genoemde getal bestaat wel, maar er zijn wel heel veel nuances aan verbonden.

Hieronder presenteer ik duidelijke, direct toepasbare cijfers, leg ik uit waarom schattingen verschillen en laat ik zien hoe bouwers en gewone gebruikers de waterrekening kunnen verlagen zonder in duurzaamheidsmonniken te veranderen.

Artikelen die u wellicht interessant vindt om na dit artikel te lezen:

🔗 Wat is een AI-dataset?
Legt uit hoe datasets de training van machine learning-modellen en de ontwikkeling ervan mogelijk maken.

🔗 Hoe AI trends voorspelt
Laat zien hoe AI patronen analyseert om veranderingen en toekomstige uitkomsten te voorspellen.

🔗 Hoe meet je de prestaties van AI?
Geeft een overzicht van de essentiële meetwaarden voor het beoordelen van nauwkeurigheid, snelheid en betrouwbaarheid.

🔗 Hoe praat je met AI?
Biedt richtlijnen voor effectieve aanmoedigingsstrategieën om de duidelijkheid, resultaten en consistentie te verbeteren.


Hoeveel water verbruikt AI? Snelle cijfers die je direct kunt gebruiken 📏

  • Per prompt ligt het typische bereik tegenwoordig tussen submilliliter voor een gemiddelde tekstprompt op een gangbaar systeem en tientallen milliliters voor een langer, rekenintensiever antwoord op een ander systeem. Zo meldt Google's productieboekhouding dat een gemiddelde tekstprompt ongeveer 0,26 ml is (inclusief alle overheadkosten voor de server) [1]. Mistral's levenscyclusanalyse schat een antwoord van een assistent van 400 tokens op ongeveer 45 ml (marginale inferentie) [2]. Context en model zijn van groot belang.

  • Het trainen van een model op grensgebiedschaal kan oplopen tot miljoenen liters , voornamelijk voor koeling en het water dat nodig is voor de elektriciteitsopwekking. Een veel geciteerde academische analyse schatte dat er ongeveer 5,4 miljoen liter is om een ​​GPT-model te trainen, inclusief ongeveer 700.000 liter die ter plaatse wordt verbruikt voor koeling - en pleitte voor slimme planning om de waterintensiteit te verlagen [3].

  • Datacenters in het algemeen: grote locaties verbruiken gemiddeld honderdduizenden gallons per dag

Laten we eerlijk zijn: die cijfers lijken in eerste instantie tegenstrijdig. En dat zijn ze ook. En daar zijn goede redenen voor.

 

Dorstige AI

AI-gebaseerde waterverbruiksstatistieken ✅

Een goed antwoord op de vraag " Hoeveel water gebruikt AI?" moet aan een aantal criteria voldoen:

  1. Grensbepaling.
    Omvat het alleen koelwater op locatie , of ook elders wordt gebruikt door energiecentrales voor de opwekking van elektriciteit? De beste praktijk maakt onderscheid tussen wateronttrekking en waterverbruik en omvat de reikwijdtes 1-2-3, vergelijkbaar met koolstofboekhouding [3].

  2. Locatiegevoeligheid
    Het waterverbruik per kWh varieert per regio en netmix, dus dezelfde prompt kan verschillende watereffecten hebben, afhankelijk van waar deze wordt aangeboden - een belangrijke reden waarom de literatuur tijd- en plaatsbewuste planning [3].

  3. Werkbelastingrealisme.
    Weerspiegelt het getal de mediane productieaanvragen , inclusief ongebruikte capaciteit en overhead van het datacenter, of alleen de accelerator op piekmomenten? Google benadrukt dat voor inferentie rekening moet worden gehouden met het volledige systeem (ongebruikte capaciteit, CPU's/DRAM en overhead van het datacenter), niet alleen met de TPU-berekening [1].

  4. Koeltechnologieën
    zoals verdampingskoeling, gesloten vloeistofkoeling, luchtkoeling en opkomende direct-to-chip -benaderingen veranderen de waterintensiteit drastisch. Microsoft introduceert ontwerpen die bedoeld zijn om het gebruik van koelwater voor bepaalde next-gen-locaties te elimineren [4].

  5. Tijdstip en seizoen.
    Hitte, vochtigheid en netomstandigheden beïnvloeden de effectiviteit van watergebruik in de praktijk; een invloedrijke studie suggereert dat grote klussen moeten worden gepland wanneer en waar de waterintensiteit lager is [3].


Wateronttrekking versus waterverbruik, uitgelegd 💡

  • Onttrekking = water dat wordt onttrokken aan rivieren, meren of aquifers (een deel wordt teruggevoerd).

  • Verbruik = water dat niet wordt teruggevoerd omdat het verdampt of wordt opgenomen in processen/producten.

Koeltorens verbruiken water door verdamping. Elektriciteitsopwekking kan onttrekken (soms wordt er een deel van verbruikt), afhankelijk van de installatie en de koelmethode. Een betrouwbaar AI-waternummer geeft aan wat het rapporteert [3].


Waar het water naartoe gaat in AI: de drie emmers 🪣

  1. Scope 1 - koeling op locatie
    Het zichtbare deel: water dat in het datacenter zelf verdampt. Ontwerpkeuzes zoals verdamping versus lucht of een gesloten vloeistofcircuit bepalen de basislijn [5].

  2. Scope 2 - elektriciteitsopwekking
    Elke kWh kan een verborgen waterlabel bevatten; de mix en locatie bepalen het liters-per-kWh-signaal dat uw werkbelasting erft [3].

  3. Scope 3 - toeleveringsketen.
    De chipfabricage is afhankelijk van ultrazuiver water. Je zult het niet terugzien in een “per prompt”-metriek, tenzij de grens expliciet de ingebedde effecten omvat (bijvoorbeeld een volledige LCA) [2][3].


Aanbieders in cijfers, met oog voor detail 🧮

  • Google Gemini geeft
    de Full-stack serveermethode weer (inclusief inactiviteit en overheadkosten van de faciliteit). De mediane tekstprompt geeft ~0,26 ml water aan, samen met ~0,24 Wh energie; de ​​cijfers weerspiegelen productieverkeer en uitgebreide grenzen [1].

  • Mistral Large 2 levenscyclus
    Een zeldzame onafhankelijke LCA (met ADEME/Carbone 4) onthult ~281.000 m³ voor training + vroeg gebruik en een inferentiemarge van ~45 ml voor een van 400 tokens [2].

  • Microsofts ambitie om waterloos te koelen:
    datacenters van de volgende generatie zijn ontworpen om geen water te verbruiken voor koeling , door gebruik te maken van direct-to-chip-benaderingen; voor beheerdoeleinden is nog steeds wat water nodig [4].

  • Algemene datacentrumschaal
    Grote exploitanten rapporteren publiekelijk dat er gemiddeld honderdduizenden gallons per dag worden verbruikt op individuele locaties; klimaat en ontwerp beïnvloeden de cijfers [5].

  • De eerdere academische basislijn.
    De baanbrekende "dorstige AI"-analyse schatte dat er miljoenen liters nodig zijn om GPT-klasse modellen te trainen, en dat 10-50 gemiddelde antwoorden ruwweg gelijk zouden kunnen staan ​​aan een van 500 ml - sterk afhankelijk van wanneer/waar ze worden uitgevoerd [3].


Waarom lopen de schattingen zo uiteen? 🤷

  • Verschillende grenzen.
    Sommige cijfers tellen alleen de koeling ter plaatse mee ; andere voegen het water voor elektriciteit ; LCA's kunnen ook de chipfabricage . Appels, sinaasappels en fruitsalade [2][3].

  • Verschillende werklasten.
    Een korte tekstprompt is geen lange multimodale/code-uitvoering; batchverwerking, gelijktijdigheid en latentiedoelen veranderen het gebruik [1][2].

  • Verschillende klimaten en roosters.
    Verdampingskoeling in een hete, droge regio is niet hetzelfde als lucht-/vloeistofkoeling in een koele, vochtige regio. De waterintensiteit van het rooster varieert sterk [3].

  • Methodologieën van leveranciers:
    Google publiceerde een systeemwijde serveermethode; Mistral publiceerde een formele LCA. Anderen bieden puntschattingen met schaarse methoden. Een spraakmakende van "een vijftiende van een theelepel" per prompt haalde de krantenkoppen, maar zonder details over de grenzen is het niet vergelijkbaar [1][3].

  • Een bewegend doelwit.
    Koeling ontwikkelt zich snel. Microsoft test waterloze koeling op bepaalde locaties; de uitrol hiervan zal het waterverbruik op locatie verminderen, zelfs als de elektriciteitsvoorziening stroomopwaarts nog steeds een watersignaal bevat [4].


Wat je vandaag kunt doen om de watervoetafdruk van AI te verkleinen 🌱

  1. Het model op de juiste schaal brengen.
    Kleinere, op de taak afgestemde modellen bereiken vaak dezelfde nauwkeurigheid, terwijl ze minder rekenkracht vereisen. De beoordeling van Mistral benadrukt sterke correlaties tussen grootte en geheugenvoetafdruk - en publiceert marginale inferentiecijfers zodat je kunt redeneren over de afwegingen [2].

  2. Kies voor waterzuinige regio's.
    Geef de voorkeur aan regio's met een koeler klimaat, efficiënte koeling en netwerken met een lagere waterintensiteit per kWh; het onderzoek naar de "dorstige AI" toont aan dat tijd- en plaatsbewuste planning helpt [3].

  3. Verplaats de werkdruk in de tijd.
    Plan de training/zware batchverwerking in voor uren waarin water efficiënt wordt benut (koelere nachten, gunstige netomstandigheden) [3].

  4. Vraag uw leverancier om transparante meetgegevens:
    de watervraag per prompt , de definities van de grenzen en of de cijfers de ongebruikte capaciteit en de overheadkosten van de faciliteit omvatten. Beleidsgroepen dringen aan op verplichte openbaarmaking om vergelijkingen tussen gelijke gevallen mogelijk te maken [3].

  5. Koeltechnologie is belangrijk.
    Als je hardware gebruikt, overweeg dan gesloten-lus/direct-naar-chip-koeling ; als je in de cloud werkt, geef dan de voorkeur aan regio's/providers die investeren in waterbesparende ontwerpen [4][5].

  6. Gebruik grijswater en hergebruikopties.
    Veel campussen kunnen niet-drinkbare bronnen vervangen of binnen kringlopen recyclen; grote exploitanten beschrijven hoe ze waterbronnen en koelkeuzes in evenwicht brengen om de netto impact te minimaliseren [5].

Een snel voorbeeld om het concreet te maken (geen universele regel): het verplaatsen van een nachtelijke trainingstaak van een hete, droge regio midden in de zomer naar een koelere, vochtigere regio in de lente – en deze uitvoeren tijdens de daluren, wanneer het koeler is – kan zowel het waterverbruik ter plaatse buiten de locatie (net) beïnvloeden. Dat is het soort praktische, probleemloze winstplanning dat mogelijk is [3].


Vergelijkingstabel: snelle tips om het waterverbruik van AI te verlagen 🧰

hulpmiddel publiek prijs Waarom het werkt
Kleinere, op de taak afgestemde modellen ML-teams, productleiders Laag tot gemiddeld Minder rekenkracht per token = minder koeling + elektriciteit en water; bewezen in LCA-achtige rapportage [2].
Regioselectie op basis van water/kWh Cloudarchitecten, inkoop Medium Schakel over naar koelere klimaten en netwerken met een lagere waterintensiteit; combineer dit met vraaggestuurde routeplanning [3].
Trainingsvensters per tijdstip MLOps, schedulers Laag Koelere nachten + betere netomstandigheden verminderen de effectieve waterintensiteit [3].
Directe koeling naar de chip/gesloten koelsysteem Datacenteractiviteiten Middelhoog Vermijdt waar mogelijk verdampingstorens, waardoor het verbruik ter plaatse drastisch wordt verminderd [4].
Controle van promptlengte en batchgrootte App-ontwikkelaars Laag Beperk het aantal tokens dat ongecontroleerd doorloopt, verwerk ze slim in batches en cache de resultaten; minder milliseconden, minder milliliter [1][2].
Checklist voor transparantie van leveranciers CTO's, leiders op het gebied van duurzaamheid Vrij Dwingt tot duidelijkheid over de grenzen (op locatie versus buiten de locatie) en tot een eerlijke vergelijking van gegevens [3].
Grijswater of hergebruikte bronnen Voorzieningen, gemeenten Medium Het vervangen van niet-drinkbaar water ontlast de drinkwatervoorziening [5].
Samenwerkingsverbanden voor hergebruik van warmte Exploitant, lokale overheden Medium Een betere thermische efficiëntie vermindert indirect de vraag naar koeling en bevordert de lokale goodwill [5].

(De prijs is opzettelijk vaag - de implementatie varieert.)


Diepgaande analyse: de beleidstrommel wordt steeds luider 🥁

Ingenieursorganisaties pleiten voor verplichte openbaarmaking van het energie- en waterverbruik van datacenters, zodat kopers en gemeenschappen de kosten en baten kunnen beoordelen. Aanbevelingen omvatten definities van de reikwijdte, rapportage op locatieniveau en richtlijnen voor de locatiekeuze - want zonder vergelijkbare, locatiegebonden meetgegevens tasten we in het duister [3].


Diepgaande analyse: datacenters drinken niet allemaal op dezelfde manier 🚰

Er bestaat een hardnekkige mythe dat “luchtkoeling geen water gebruikt”. Dat klopt niet helemaal. Luchtintensieve systemen verbruiken vaak meer elektriciteit , wat in veel regio’s betekent dat er verborgen water waterkoeling daarentegen het stroomverbruik en de uitstoot verminderen ten koste van het water ter plaatse. Grote exploitanten wegen deze afwegingen expliciet per locatie af [1][5].


Diepgaande analyse: een snelle realiteitscheck van virale beweringen 🧪

Je hebt misschien wel eens gewaagde beweringen gezien dat één prompt gelijk staat aan "een fles water", of juist aan "slechts een paar druppels". Een betere houding: bescheidenheid met wiskunde . De geloofwaardige uitersten van vandaag zijn ~0,26 ml voor een gemiddelde productieprompt met volledige overheadkosten voor het serveren [1] en ~45 ml voor een antwoord van een assistent met 400 tokens (marginale gevolgtrekking) [2]. De veel gedeelde "een vijftiende van een theelepel" mist een publieke grens/methode; beschouw het als een weersvoorspelling zonder de stad [1][3].


Mini-FAQ: Hoeveel water gebruikt AI? Nogmaals, in begrijpelijke taal 🗣️

  • Dus, wat moet ik in een vergadering zeggen?
    "Afhankelijk van de vraag varieert het van druppels tot een paar slokjes , afhankelijk van het model, de lengte en de locatie. Training vereist grote hoeveelheden , geen kleine plasjes." Noem vervolgens een of twee voorbeelden uit bovenstaande lijst.

  • Is AI uniek slecht?
    Het is uniek geconcentreerd : krachtige chips die dicht op elkaar gepakt zitten, zorgen voor een grote koelingsbehoefte. Maar datacenters zijn ook de plek waar de meest efficiënte technologie doorgaans als eerste terechtkomt [1][4].

  • Wat als we gewoon alles overschakelen op luchtkoeling?
    Je zou ter plaatse , maar elders via elektriciteit kunnen verhogen. Geavanceerde operators wegen beide af [1][5].

  • En hoe zit het met toekomstige technologie?
    Ontwerpen die het gebruik van koelwater op grote schaal vermijden, zouden een gamechanger zijn voor Scope 1. Sommige exploitanten bewegen zich in deze richting; de elektriciteitsvoorziening stroomopwaarts voert nog steeds een watersignaal totdat de netwerken veranderen [4].


Slotopmerkingen - Te lang, ik heb het niet gelezen 🌊

  • Per prompt: denk aan sub-milliliter tot tientallen milliliters , afhankelijk van het model, de lengte van de prompt en waar deze wordt uitgevoerd. Mediaan prompt ~0,26 ml op één grote stack; ~45 ml voor een antwoord van 400 tokens op een andere [1][2].

  • Training: miljoenen liters voor grensmodellen, waardoor planning, locatiebepaling en koeltechnologie cruciaal zijn [3].

  • Wat te doen: modellen op de juiste schaal kiezen, waterbesparende regio's selecteren, zware klussen naar koelere uren verplaatsen, de voorkeur geven aan leveranciers die waterbesparende ontwerpen aanbieden en transparante grenzen eisen [1][3][4][5].

Een ietwat gebrekkige metafoor om mee af te sluiten: AI is een dorstig orkest - de melodie is de computer, maar de drums zijn het koelwater en het water dat nodig is voor de stroomvoorziening. Stem de band af, en het publiek krijgt nog steeds de muziek te horen, zelfs zonder dat de sprinklers aanspringen. 🎻💦


Referenties

  1. Google Cloud Blog - Hoeveel energie verbruikt Google's AI? We hebben de berekening gemaakt (methodologie + ~0,26 ml gemiddelde prompt, overheadkosten voor een volledige portie). Link
    (Technisch document PDF: Het meten van de milieu-impact van het leveren van AI op Google-schaal .) Link

  2. Mistral AI - Onze bijdrage aan een wereldwijde milieunorm voor AI (LCA met ADEME/Carbone 4; ~281.000 m³ training + eerste gebruik; ~45 ml per van 400 tokens , marginale inferentie). Link

  3. Li et al. - AI minder ‘dorstig’ maken: het verborgen waterverbruik van AI-modellen blootleggen en aanpakken (training van miljoenen liters , tijd- en plaatsgebonden planning, onttrekking versus consumptie). Link

  4. Microsoft - Datacenters van de volgende generatie gebruiken geen water meer voor koeling (direct-to-chip-ontwerpen gericht op watervrije koeling op bepaalde locaties). Link

  5. Google-datacenters - Duurzaam opereren (afwegingen voor koeling per locatie; rapportage en hergebruik, inclusief gezuiverd afvalwater/grijs water; gemiddelde dagelijkse gebruiksordes per locatie). Link

Vind de nieuwste AI in de officiële AI Assistant Store

Over ons

Terug naar de blog