Vad är Cross-validering?

October 12

Cross-validering är en metod som används i kemi och en rad andra vetenskapliga områden för att jämföra resultaten från flera experimentella metoder med samma mål. Helst ska korsvalidering validera både experimentella metoder genom att returnera samma resultat. Olika resultat kan indikera mänskliga faktorn eller fel i experimentell design. Skillnaderna kan användas för att identifiera fel och att förfina en eller flera av de experimentella metoder tills överensstämmande och repeterbara resultat erhålls.

För korsvalidering för att lyckas, är det i allmänhet nödvändigt för forskare att veta att någon av metoderna returnerar korrekta resultat. Målet är alltså att göra nya och obekräftade metod, eller jämför, ger resultat som är identiska med dem i den kända metoden, eller referens. Om ingen metod är känd för att vara exakt, kan de nog justeras för att returnera samma resultat, men det finns fortfarande inga garantier för att dessa resultat är korrekta.

Forskare använder ofta korsvalidering vid införandet av en ny, mer effektiv experimentell metod som är tänkt att ersätta en äldre metod. Den nya metoden är bara användbar om den kan användas för samma ändamål som den metod som den är tänkt att ersätta. Cross-validering används för att säkerställa att den nya metoden är lika effektiv som den gamla och att effektiviteten kommer inte till priset av noggrannhet.

Resultaten av experimenten som används för korsvalidering kan beredas kvalitativt eller kvantitativt baserat på karaktären av experimentet. Framgången för några enkla kemiska experiment kan bedömas genom enkla visuella ledtrådar såsom färgförändring. En ny metod som resulterar i samma färgförändring kan, i vissa fall, bedömdes framgångsrik. De flesta moderna vetenskapliga forskningen är dock till stor del bygger på kvantitativa metoder. Som sådan måste kvantitativ information jämföras, och skillnader i numeriska data används för att bedöma framgång eller misslyckande för ett valideringsexperiment.

Mycket korsvalideringsresultatet är beroende av stora kroppar av statistiska uppgifter snarare än på kvalitativ information eller om en eller två värden som temperatur eller surhet. För sådana statistiska uppgifter, finns det ingen enskild visst nummer eller uppsättning siffror som stämmer medan alla andra är fel. Framgången för en korsvaliderings bedöms baserat på huruvida eller inte de data som returneras faller inom ett visst tröskelvärde för acceptabel fel. I sådana experiment, kan en del av de värden som return vara acceptabelt, medan andra är felaktiga, vilket tyder på att vissa delar av de testade metoderna måste ses över.