Metodologi

Sådan tester og scorer vi AI-værktøjer

BedsteAI dækker omkring 250 AI-værktøjer på dansk. Den her side forklarer præcis hvordan vi bestemmer om et værktøj kommer på sitet, hvilke seks ting vi vurderer, hvordan tallene bliver til, og hvor du kan klage hvis du er uenig.

Hvorfor en eksplicit metodologi

De fleste AI-tool-rangeringer på nettet er gætværk i pænt tøj. Affiliate-links bestemmer rækkefølgen, anmelderne har aldrig brugt værktøjet, og “test” er en sætning fra leverandørens pressemeddelelse. Det er ikke det, vi laver.

Når vi siger ChatGPT scorer 47 ud af 60 og Claude scorer 51 ud af 60, vil du gerne vide hvor de tal kommer fra. Hvis du ikke kan efterprøve dem, er ratingen ikke værd at læse. Derfor er den her side så detaljeret. Hvis du har spørgsmål til en konkret score, kan du regne den efter selv — eller skrive til os.

Hvilke værktøjer kommer på sitet

Vi kuraterer i stedet for at automatisere. At “dække alle AI-værktøjer” er ikke et mål — det ville give et site fyldt med døde links og halve produkter. Vi optager kun værktøjer der opfylder fire krav:

  • Offentligt tilgængelig pris. Hvis du skal “ringe for pris”, er det enterprise-salg — ikke et værktøj almindelige brugere kan bruge. Det kommer ikke med, medmindre der også findes en self-serve plan.
  • Live produkt med betalende brugere. Beta-produkter, ventelister og “coming soon”-sider ekskluderes. Vi venter til der faktisk er noget at anmelde.
  • Dokumentation eller support. Hvis der ikke er en hjælpeside, en email eller en discord du kan stille spørgsmål til, lader vi være. Det er ikke et produkt endnu, det er en demo.
  • Relevant for danske brugere. Værktøjer der eksplicit kun virker på engelsk og kun har amerikanske use cases (fx US-skat-software) kommer ikke med. Generelle AI-værktøjer der bare har engelsk UI er fine — vi fortæller bare om de håndterer dansk eller ej.

Vi ekskluderer aktivt værktøjer der har dokumenterede problemer med datasikkerhed, ulovlig brug af træningsdata, eller hvis primære funktion er at omgå ophavsret. Det er en redaktionel beslutning, og vi forklarer den i anmeldelsen hvis spørgsmålet kommer op.

De seks score-dimensioner

Hvert værktøj får en samlet score fra 0 til 60. Den er summen af seks dimensioner, som hver vejer 0 til 10. De er ligeligt vægtede med vilje — det betyder du kan kigge på hvilken dimension der betyder mest for dig, og bruge den til at navigere. En person der kun bekymrer sig om pris kan se på pris-scoren alene; en person der kun bekymrer sig om GDPR kan se på data-privatliv-scoren alene.

Funktioner

0–10 point

Hvor meget kan værktøjet i forhold til konkurrenterne i samme kategori. Vi tæller funktioner fra leverandørens dokumentation (de funktioner du faktisk får — ikke roadmap-punkter) og normaliserer mod kategoriens bredeste værktøj. Værktøjet med flest funktioner får 10. Et værktøj med halvdelen får 5.

Vi tæller ikke trivielle features (“dark mode”, “copy to clipboard”) — kun ting der reelt udvider hvad du kan løse med værktøjet.

Pris

0–10 point

Vi rater pris efter hvor langt en typisk dansk soloiværksætter eller lille team kan komme uden at skulle betale. Skalaen er:

  • Helt gratis: 10 point
  • Freemium med brugbar gratis-tier: 7 point
  • Betalt med gratis prøveperiode: 5 point
  • Betalt uden gratis adgang: 3 point
  • Enterprise (kontakt-for-pris): 2 point

Vi kigger ikke på den absolutte pris — et godt $20/md-værktøj er ikke ringere end et gratis værktøj hvis det leverer mere. Pris-scoren handler om hvor lavt din indgangstærskel er, ikke om totalomkostning over tre år.

Dansk support

0–10 point

Hvor godt værktøjet håndterer dansk i praksis. Vi tester med konkrete danske inputs: en email på dansk, et blogindlæg om et dansk emne, et juridisk udtryk. Skalaen:

  • Fuld dansk: 10 point. Native UI, fejlfri dansk output, dansk kundesupport.
  • God dansk: 7 point. Dansk output uden anglicismer eller danglish, men evt. engelsk UI.
  • Basis dansk: 4 point. Forstår dansk, men output er klodset eller inkonsistent.
  • Ingen dansk: 1 point. Værktøjet er kun beregnet til engelsk.

Hvis et værktøj er bedre på engelsk end dansk, siger vi det højt. Det er en almindelig svaghed — også for de største modeller.

Data og privatliv

0–10 point

Hvor sikkert er det at fodre værktøjet med arbejdsdata. Vi kigger primært på hvor data behandles og lagres:

  • EU/EØS: 10 point
  • UK eller Schweiz (adequacy-aftale): 8 point
  • USA (med standard contractual clauses): 5 point
  • Ukendt eller blandet: 4 point
  • Kina eller andre uden adequacy: 2 point

Vi tilføjer eller trækker fra hvis leverandøren eksplicit bruger dine inputs til træning af modeller (træk fra), eller hvis de tilbyder no-training-toggle (hold fast). Hvis et værktøj scorer lavt her, er det ikke ensbetydende med at du ikke må bruge det — det betyder bare at du skal være opmærksom på hvad du putter ind.

Brugervenlighed

0–10 point

Hvor hurtigt en almindelig dansk bruger kan komme i gang. Scoren er en sammensætning: gratis adgang eller prøve giver point, simpel onboarding giver point, og dansk support oven i tæller med. Vi straffer værktøjer der kræver kreditkort før du kan se UI’et, eller som har 47 menuer på første skærm.

Den her score korrelerer ikke 1:1 med “hvor godt værktøjet er”. Avancerede værktøjer (fx Stable Diffusion via ComfyUI) kan score lavt på brugervenlighed og højt på funktioner — det er en feature, ikke en bug. Brug scoren til at vælge værktøj efter dit eget niveau.

Popularitet

0–10 point

Et grovere mål for økosystem og overlevelsesodds. Værktøjer der har eksisteret før 2020 og er bredt udbredte (ChatGPT, Notion, Canva) får højere score her. Helt nye værktøjer eller værktøjer fra ét-mands-firmaer scorer lavere — ikke fordi de er dårligere, men fordi der er højere risiko for at de er væk om 12 måneder.

Vægter du innovation højere end stabilitet, så ignorér bare popularitets-scoren. Den er den ene dimension hvor vi ikke selv tror den er vigtigst — den er med fordi mange læsere vil vide om de bygger oven på et fundament der holder.

Den samlede score er en simpel sum. Vi gør ikke noget magi med vægte. Hvis et værktøj scorer 8/10/4/10/9/6 = 47/60, så er det det. Du kan udregne det selv. Du kan også ignorere totalen og vælge efter den dimension der vægter for dig.

Test-perioden

Vi sammenstiller information om hvert værktøj fra tre kilder: leverandørens officielle dokumentation, offentligt tilgængelige third-party-anmeldelser (G2, Reddit, branchemedier), og vores egen brug. For de 30-40 værktøjer vi selv bruger jævnligt, er anmeldelsen baseret på hands-on brug over uger eller måneder. For mindre velkendte værktøjer er anmeldelsen baseret på dokumenteret produktinformation; det fremgår tydeligt i anmeldelsen at vi ikke har testet selv.

Vi gennemgår hvert værktøj mindst hver 90 dag. Hvis pris, funktioner eller dansk-support ændrer sig markant, opdaterer vi anmeldelsen og noterer ændringen. Værktøjer der lukker eller skifter prismodel mister adgangen til at være på sitet indtil vi har gennemgået dem igen.

Hvad gør os anderledes

  • Ingen betaling for placering. Du kan ikke købe dig til en bedre score eller en højere placering på “Bedste AI”-rangeringerne. Det er en hård regel, og vi har afvist tilbud om det. Hvis et værktøj har et affiliate-program tilkoblet, er det fordi de har et — ikke fordi vi rangerer dem højere.
  • Vi tester på dansk specifikt. De fleste internationale review-sites tester kun på engelsk. Det er en helt anden oplevelse end at skulle bruge værktøjet til at skrive en mail på dansk eller forstå et dansk dokument. Vores rating reflekterer dansk brug, ikke kun engelsk.
  • GDPR og datalokation tæller med i scoren. Det er ikke en eftertanke. For mange danske arbejdspladser er det forskellen mellem “må bruges” og “må ikke bruges”.
  • Vi opdaterer mindst hver 90 dag. AI-markedet ændrer sig hurtigt. En anmeldelse fra 2024 er allerede misvisende i dag. Hver anmeldelse har en “sidst opdateret”-dato, og hvis den er mere end seks måneder gammel, bør du tjekke leverandørens egen side også.
  • Vi disclosure’r affiliate-links. Når et link er affiliate, er det markeret medrel=“sponsored”så Google og du selv kan se det. De links påvirker ikke rangeringen — det er en fast regel.
  • Vi laver ikke “sponsored content”. Vi tager ikke betaling for at skrive en anmeldelse. Vi tager ikke betaling for at flytte et værktøj op i en rangering. Hvis du nogensinde ser en sektion på sitet der ligner reklame, er det et standard AdSense-banner — det er produkt-uafhængigt og fyldes af Google, ikke af os.

AI Act og brug af AI

EU's AI Act (forordning 2024/1689), Artikel 50, stiller fra den 2. august 2026 transparenskrav til alle der publicerer AI-genereret indhold. Vi tager forpligtelsen alvorligt — også før den træder i kraft. Her er hvordan vi bruger AI på BedsteAI.

  • Tool-anmeldelser er menneske-skrevne med redaktionel kontrol. Vi bruger AI som research-værktøj — fx til at finde sammenligninger, samle priser, eller skitsere første-udkast. Men hver eneste anmeldelse, scoring og konklusion er gennemgået, redigeret og godkendt af et menneske før den offentliggøres. Det opfylder Art. 50(4)'s undtagelse om “menneskelig redaktionel kontrol”.
  • Lærepladsen-indhold er ligeledes menneske-redigeret. Alle artikler, eksempler og workflows har gennemgået redaktionel review før udgivelse, selv hvor AI har bidraget til research eller første-udkast.
  • AI-genererede billeder markeres. Hvor vi bruger AI-genererede illustrationer eller bannere, tilføjer vi en synlig “AI-genereret”-mærkning i billedteksten. Vi laver ikke deepfakes af rigtige personer, ikke vildledende fotorealistisk indhold, og ikke AI-genererede portrætter af reelle eksperter eller brugere.
  • Ingen automatiseret content om aktuelle nyheder. Indhold om samfundsforhold, nyheder eller offentlig debat publiceres aldrig fuldautomatisk. Hvis vi en dag tilføjer en automatiseret news-aggregator (fx en “AI Nyt”- feed), vil hvert enkelt indlæg have en tydelig “AI-genereret indhold”-disclosure som krævet af Art. 50(4).
  • Ingen chatbot eller AI-samtale-grænseflade. BedsteAI har pt. ingen AI-chatbot eller assistent som brugere interagerer med. Hvis vi tilføjer det fremover, vil brugere blive klart informeret om at de taler med en AI — ikke et menneske — i overensstemmelse med Art. 50(1).

Har du spottet AI-genereret indhold der ikke er korrekt mærket? Skriv til marvin@kytner.com — vi retter omgående og opdaterer denne side med læringen.

Hvor du kan klage

Hvis du er uenig med en rating, har info der modsiger vores test, eller har spottet en faktuel fejl: skriv til marvin@kytner.com. Inkludér gerne et link til kilden, hvis du har en. Vi læser alt, og vi opdaterer hvis du har ret. Svartid er typisk 1-2 hverdage.

Hvis det er din virksomhed der er rated, og du synes scoren er forkert, er det også her du skriver. Vi kan ikke garantere du får en højere score (det er trods alt det her side handler om), men vi kan garantere at vi læser dit argument og vurderer det åbent.

Metodologi sidst opdateret: 2. maj 2026. Næste planlagte gennemgang: hver 90 dag.

Spørgsmål eller forslag til metodologien? Skriv til marvin@kytner.com.