Logotyp
Unionpedia
Kommunikation
Ladda ned på Google Play
Ny! Ladda ner Unionpedia på din Android™-enhet!
Fri
Snabbare tillgång än webbläsare!
 

Datautvinning

Index Datautvinning

Databrytning, informationsutvinning eller datautvinning, av engelskans data mining, betecknar verktyg för att söka efter mönster, samband och trender i stora datamängder.

85 relationer: Algoritm, Anomali, Artificiell intelligens, Artificiellt neuronnät, Bayes sats, Beslutsträd, Big data, Bioinformatik, Bortfall, Business intelligence, Comma-separated values, Confounding, Data (representation), Data warehouse, Datatyp, Dendrogram, Djupinlärning, Estimator, Expertsystem, Extrapolering, Faktoranalys, Försvarets radioanstalt, Försvarsdepartementet, Filformat, FRA-lagen, Genetisk programmering, Graf (grafteori), Heuristik (datalogi), Histogram, Hypotes, Hypotesprövning, Induktion (filosofi), Interpolation, IT-forensiker, Java (programspråk), JSON, Kalkylprogram, Klassificerare, Klusteranalys (datavetenskap), Komplexitet (beräkningsvetenskap), Korrelation, Kvantitativ forskning, Maskinöversättning, Maskininlärning, Matematisk modell, Mängd, Mönsterigenkänning, Modeord, Multipel linjär regression, Multivariat statistik, ..., Naiv bayesiansk klassificerare, Negativt prediktivt värde, Norm (matematik), Oberoende variabel, Optimeringslära, Ortogonalitet, Outlier, P-värde, Positivt prediktivt värde, Prediktion, Principalkomponentanalys, Python (programspråk), R (programspråk), Regressionsanalys, Relationsdatabas, Reliabilitet, Sambandsdiagram, Sensitivitet, Signifikans, Skalnivå, Skriptspråk, Specificitet, SPSS, Standardfel, Stödvektormaskin, Subjektbaserad igenkänning, Suddig logik, Text mining, Trafikanalys (metod), Träd (datastruktur), Upptäckt, Vetenskaplig modell, Visualisering, Web service, XML. Förläng index (35 mer) »

Algoritm

Flödesscheman ger en grafisk representation av algoritmer. sovjetiskt frimärke. En algoritm är, inom matematiken och datavetenskapen, en ändlig uppsättning (mängd) otvetydiga instruktioner som efter exekvering löser ett problem.

Ny!!: Datautvinning och Algoritm · Se mer »

Anomali

En anomali är en avvikelse från det normala.

Ny!!: Datautvinning och Anomali · Se mer »

Artificiell intelligens

Chatboten ELIZA från 1966 fick människor att konversera som med en psykoterapeut (här i en implementation från 2005). Artificiell intelligens (AI) eller maskinintelligens är förmågan hos datorprogram och robotar att efterlikna människors och andra djurs naturliga intelligens, främst kognitiva funktioner såsom förmåga att lära sig saker av tidigare erfarenheter, förstå naturligt språk, lösa problem, planera en sekvens av handlingar och att generalisera.

Ny!!: Datautvinning och Artificiell intelligens · Se mer »

Artificiellt neuronnät

Ett neuronnät (rekommenderad term enligt Svenska datatermgruppen) eller artificiellt neuronnät (ANN) är ett samlingsnamn på ett antal självlärande algoritmer som försöker efterlikna funktionen i biologiska neuronnät (exempelvis hjärnan).

Ny!!: Datautvinning och Artificiellt neuronnät · Se mer »

Bayes sats

Bayes sats eller Bayes teorem är en sats inom sannolikhetsteorin, som används för att bestämma betingade sannolikheter; sannolikheten för ett utfall givet ett annat utfall.

Ny!!: Datautvinning och Bayes sats · Se mer »

Beslutsträd

Ett beslutsträd är ett beslutsstödsverktyg som använder en trädliknande modell av beslut och beslutens möjliga konsekvenser, inklusive eventuella händelseresultat, resurskostnader och nytta.

Ny!!: Datautvinning och Beslutsträd · Se mer »

Big data

Big data utgörs av digitalt lagrad information av sådan storlek (vanligen terabyte och petabyte), att det är svårt att bearbeta den med traditionella databasmetoder.

Ny!!: Datautvinning och Big data · Se mer »

Bioinformatik

En av bioinformatikens triumfer är att den gett en mycket stabilare grund för systematiken och också kunnat rätta till många fel i tidigare systematik. Här visas huvudgrenarna i livets träd Bioinformatik är en tvärvetenskaplig disciplin där algoritmer för analys av biologiska (särskilt molekylärbiologi) data utvecklas.

Ny!!: Datautvinning och Bioinformatik · Se mer »

Bortfall

Bortfall är inom statistik andelen ogiltiga mätvärden.

Ny!!: Datautvinning och Bortfall · Se mer »

Business intelligence

Business intelligence, förkortat BI, på svenska även datorstödd affärsanalys, eller organiserad insamling och analys av affärsunderrättelser, är ett samlingsbegrepp för färdigheter, processer, metoder, tekniker och datorbaserade verktyg, för organisationer att bättre förstå sin verksamhet eller sitt affärsområde genom insamling av omvärldsbevakning och omvärldsanalys.

Ny!!: Datautvinning och Business intelligence · Se mer »

Comma-separated values

Comma-separated values (engelska för ’kommaseparerade värden’), CSV, är en grupp textfilsformat som används för att spara och överföra tabelldata.

Ny!!: Datautvinning och Comma-separated values · Se mer »

Confounding

Confounding (en: sammanblandning av orsaksfaktorer, ibland snedvridning) är en term inom forskningsmetodik som betecknar okontrollerade eller okända variabler som samvarierar med både beroende och oberoende faktorer.

Ny!!: Datautvinning och Confounding · Se mer »

Data (representation)

Data (plural) kallas den tekniska representationen av information som lagras i filer på en dator.

Ny!!: Datautvinning och Data (representation) · Se mer »

Data warehouse

Översikt över data warehouse Ett data warehouse, även kallat informationslager eller datalager, är en sammanställning av information från flera källor, utförd på ett sådant sätt att det underlättar en avancerad analys av informationen.

Ny!!: Datautvinning och Data warehouse · Se mer »

Datatyp

I programspråk är en datatyp ett attribut för data som berättar för datorn (och programmeraren) vilken sorts information data bär på.

Ny!!: Datautvinning och Datatyp · Se mer »

Dendrogram

Traditionell visualisering Dendrogram (grekiska: dendron, träd) är en samlingsterm för trädliknande grafer, vilka representerar ett klassificeringsschema och visualiserar en klusteranalys inom multivariat statistik.

Ny!!: Datautvinning och Dendrogram · Se mer »

Djupinlärning

Djup maskininlärning (engelska: deep learning, deep machine learning, deep structured learning eller hierarchical learning) är en del av området maskininlärning genom artificiella neuronnät.

Ny!!: Datautvinning och Djupinlärning · Se mer »

Estimator

I statistik är estimator en regel för att beräkna en skattning av en given parameter baserad på ett stickprov av observerade data.

Ny!!: Datautvinning och Estimator · Se mer »

Expertsystem

Ett expertsystem, ibland kallat beslutsstödsystem, är ett datorprogram som besvarar frågor från användaren genom att dra slutsatser baserade på en samling regler och i förväg lagrade fakta.

Ny!!: Datautvinning och Expertsystem · Se mer »

Extrapolering

Extrapolering innebär att hitta ett meningsfullt värde till den blå boxen. Extrapolering är estimering av mätvärden utanför ett mätområde.

Ny!!: Datautvinning och Extrapolering · Se mer »

Faktoranalys

Faktoranalys (betydelsenära med principalkomponentanalys) är en statistisk metod som används för att beskriva samvariationen mellan två eller fler variabler genom att mäta ett antal bakomliggande faktorer.

Ny!!: Datautvinning och Faktoranalys · Se mer »

Försvarets radioanstalt

Försvarets radioanstalt (FRA) är en svensk civil myndighet som sorterar under Försvarsdepartementet.

Ny!!: Datautvinning och Försvarets radioanstalt · Se mer »

Försvarsdepartementet

Försvarsdepartementet (Fö) är ett departement inom det svenska Regeringskansliet med ansvar för totalförsvaret.

Ny!!: Datautvinning och Försvarsdepartementet · Se mer »

Filformat

Med filformat avses den interna struktur som digitala datafiler hyser.

Ny!!: Datautvinning och Filformat · Se mer »

FRA-lagen

Försvarets radioanstalt är den myndighet som genom FRA-lagen får utvidgade rättigheter att bedriva spaning. FRA-lagen är den informella benämningen på en rad lagändringar i Sverige samt en ny lag, som föreslogs av regeringen i proposition 2006/07:63 – En anpassad försvarsunderrättelseverksamhet. De lagar som ändrats är om försvarsunderrättelseverksamhet, om elektronisk kommunikation och Sekretesslagen, vilken dock har upphört att gälla och ersatts av.

Ny!!: Datautvinning och FRA-lagen · Se mer »

Genetisk programmering

Genetisk programmering är en teknik där maskiner kan programmera sig själva genom en form av trial and error.

Ny!!: Datautvinning och Genetisk programmering · Se mer »

Graf (grafteori)

En graf är det grundläggande begreppet inom grafteorin.

Ny!!: Datautvinning och Graf (grafteori) · Se mer »

Heuristik (datalogi)

En heuristik är inom datalogi en metod eller algoritm för att lösa ett beräkningskomplext problem snabbare när klassiska metoder är för långsamma, eller för att hitta en ungefärlig lösning när klassiska metoder misslyckas med att hitta en exakt lösning.

Ny!!: Datautvinning och Heuristik (datalogi) · Se mer »

Histogram

Ett histogram Histogram är en sorts stapeldiagram som visar hur många det finns för varje egenskapsintervall.

Ny!!: Datautvinning och Histogram · Se mer »

Hypotes

En hypotes är ett ännu obevisat antagande om verkligheten.

Ny!!: Datautvinning och Hypotes · Se mer »

Hypotesprövning

Hypotesprövning är inom matematisk statistik en vetenskaplig metod, som används då man vill göra uttalanden om en viss parameter, fysikalisk storhet eller en stor mängd individer, baserat på experiment eller en liten delmängd av dessa individer.

Ny!!: Datautvinning och Hypotesprövning · Se mer »

Induktion (filosofi)

Induktion är inom vetenskapsteori en slutledningmetod som härleder generella slutsatser utifrån ett antal enskilda fall.

Ny!!: Datautvinning och Induktion (filosofi) · Se mer »

Interpolation

Interpolering är inom matematiken en metod för att generera nya datapunkter från en diskret mängd av befintliga datapunkter, det vill säga beräkning av funktionsvärden som ligger mellan redan kända värden.

Ny!!: Datautvinning och Interpolation · Se mer »

IT-forensiker

Hårddisk i närbild. IT-forensiker är inom myndigheter IT-världens motsvarighet till kriminaltekniker.

Ny!!: Datautvinning och IT-forensiker · Se mer »

Java (programspråk)

Java är ett objektorienterat programspråk som konstruerades av bland andra James Gosling på Sun Microsystems under 90-talets tidigare hälft.

Ny!!: Datautvinning och Java (programspråk) · Se mer »

JSON

JSON (JavaScript Object Notation), är ett kompakt, textbaserat format som används för att utbyta data.

Ny!!: Datautvinning och JSON · Se mer »

Kalkylprogram

400px Ett kalkylprogram är ett tillämpningsprogram som är konstruerat för att utföra matematiska beräkningar i tabeller.

Ny!!: Datautvinning och Kalkylprogram · Se mer »

Klassificerare

En klassificerare är en funktion från en godtycklig mängd till en ändlig mängd.

Ny!!: Datautvinning och Klassificerare · Se mer »

Klusteranalys (datavetenskap)

Klusteranalys av data som resulterat i tre kluster på ett euklidiskt plan. Inom datavetenskap och statistik innebär klusteranalys gruppering av datamängder i delmängder som kallas kluster.

Ny!!: Datautvinning och Klusteranalys (datavetenskap) · Se mer »

Komplexitet (beräkningsvetenskap)

Komplexitet beskriver inom beräkningsvetenskap hur omfattande och resurskrävande ett problem är.

Ny!!: Datautvinning och Komplexitet (beräkningsvetenskap) · Se mer »

Korrelation

Korrelation anger inom statistiken styrkan och riktningen av ett samband mellan två eller flera variabler.

Ny!!: Datautvinning och Korrelation · Se mer »

Kvantitativ forskning

Kvantitativ forskning är en typ av forskningsmetod som fokuserar på mätbara data som kan uttryckas med hjälp av siffror.

Ny!!: Datautvinning och Kvantitativ forskning · Se mer »

Maskinöversättning

Maskinöversättning avser översättning av olika mänskliga språk med hjälp av en dator.

Ny!!: Datautvinning och Maskinöversättning · Se mer »

Maskininlärning

Maskininlärning (engelska: machine learning) är ett område inom artificiell intelligens, och därmed inom datavetenskapen.

Ny!!: Datautvinning och Maskininlärning · Se mer »

Matematisk modell

Matematisk modell eller matematisk modellering, en abstrakt beskrivning av ett verkligt fenomen med matematiska uttryck.

Ny!!: Datautvinning och Matematisk modell · Se mer »

Mängd

En mängd är en samling av objekt.

Ny!!: Datautvinning och Mängd · Se mer »

Mönsterigenkänning

Mönsterbaserad igenkänning är en av flera tekniker för informationsutvinning och betecknar sökandet efter mönster i stora datamängder.

Ny!!: Datautvinning och Mönsterigenkänning · Se mer »

Modeord

Ett modeord är ett ord som för tillfället är särskilt vanligt.

Ny!!: Datautvinning och Modeord · Se mer »

Multipel linjär regression

Inom statistik är multipel linjär regression en teknik med vilken man kan undersöka om det finns ett statistiskt samband mellan en responsvariabel (Y) och två eller flera förklarande variabler (X).

Ny!!: Datautvinning och Multipel linjär regression · Se mer »

Multivariat statistik

Multivariat statistik är statistisk analys som behandlar mer än en variabel åt gången.

Ny!!: Datautvinning och Multivariat statistik · Se mer »

Naiv bayesiansk klassificerare

I maskininlärning, exempelvis datamining, är naiva bayesianska klassificerare en familj av enkla sannolikhetsbaserade klassificerare baserade på tillämpning av Bayes sats med starka (naiva) oberoende antaganden mellan funktionerna.

Ny!!: Datautvinning och Naiv bayesiansk klassificerare · Se mer »

Negativt prediktivt värde

Negativt prediktivt värde (npv) är ett begrepp inom statistiken som definieras som andelen av de som testas negativa för en sjukdom som verkligen är negativa.

Ny!!: Datautvinning och Negativt prediktivt värde · Se mer »

Norm (matematik)

Manhattannormen (röd, blå, gul) och euklidisk norm (grön) Inom matematiken är norm ett sätt att tilldela en längd till objekt, vilka vanligen är definierade som vektorrum.

Ny!!: Datautvinning och Norm (matematik) · Se mer »

Oberoende variabel

Oberoende variabel.

Ny!!: Datautvinning och Oberoende variabel · Se mer »

Optimeringslära

Optimeringslära, optimeringsteori eller optimering (läs mer om optimering i allmän betydelse) är den matematiska lära som beskriver olika metoder för hur ett optimalt värde, det vill säga ett maximum eller ett minimum, kan erhållas ur en funktion givet vissa förutsättningar samt givet vissa restriktioner, så kallade bivillkor.

Ny!!: Datautvinning och Optimeringslära · Se mer »

Ortogonalitet

Ortogonalitet är inom matematiken en egenskap hos par av bland annat vektorer och funktioner, som enklast kan beskrivas som att de är vinkelräta mot varandra.

Ny!!: Datautvinning och Ortogonalitet · Se mer »

Outlier

Outlier (ibland utliggare) är inom statistik och matematisk statistik benämning för ett avvikande värde, ett ytterlighetsvärde – ett observerat värde som skiljer sig kraftigt från andra värden.

Ny!!: Datautvinning och Outlier · Se mer »

P-värde

Inom statistisk hypotesprövning är p-värdet sannolikheten för att, givet att nollhypotesen är sann, ändå erhålla en teststatistika minst så extrem som den faktiskt observerade.

Ny!!: Datautvinning och P-värde · Se mer »

Positivt prediktivt värde

Positivt prediktivt värde (ppv) är ett begrepp inom statistiken och definieras som andelen av dem som testas positiva för en sjukdom som verkligen är positiva.

Ny!!: Datautvinning och Positivt prediktivt värde · Se mer »

Prediktion

Prediktion är en metod inom signalbehandlingen för att estimera framtida (okända) värden i en stokastisk process, baserat på tidigare (kända) värden.

Ny!!: Datautvinning och Prediktion · Se mer »

Principalkomponentanalys

kovariansmatrisen skalad med kvadratroten ur respektive egenvärde, och flyttade så att de utgår från datans medelvärde. Principalkomponentanalys, ofta förkortat PCA av engelskans principal component analysis, är en linjär ortogonal transform som gör att den transformerade datans dimensioner är ortogonala; det vill säga att de är oberoende och inte har någon kovarians (eller korrelation).

Ny!!: Datautvinning och Principalkomponentanalys · Se mer »

Python (programspråk)

Python är ett programspråk som lanserades 1991 av Guido van Rossum.

Ny!!: Datautvinning och Python (programspråk) · Se mer »

R (programspråk)

R är ett programspråk och en utvecklingmiljö som huvudsakligen används för statistiska beräkningar och datavisualisering, för artificiell intelligens inom informationsutvinning (data mining) samt inom nationalekonomi och andra ämnen som använder sig av numeriska beräkningar.

Ny!!: Datautvinning och R (programspråk) · Se mer »

Regressionsanalys

Regressionslinjen i blått är funktionen som bäst approximerar de röda datapunkterna Regressionsanalys, regression, är en metod inom statistik där målet är att skapa en funktion som bäst passar observerad data.

Ny!!: Datautvinning och Regressionsanalys · Se mer »

Relationsdatabas

En relationsdatabas är en databas där information ("data") är organiserad i relationer (även kallade tabeller) bestående av rader (kallas också poster eller tupler) och kolumner (fält).

Ny!!: Datautvinning och Relationsdatabas · Se mer »

Reliabilitet

Reliabilitet beskriver tillförlitligheten hos en mätning eller ett beteendevetenskaplig mätinstrument (ett prov) och används inom exempelvis mätteknik och psykometri.

Ny!!: Datautvinning och Reliabilitet · Se mer »

Sambandsdiagram

Tvådimensionellt sambandsdiagram som visar sambandet mellan tiden mellan utbrott och utbrottstiden för gejsern Old Faithful i Yellowstone nationalpark.Ett tredimentionellt sambandsdiagram där värdet av tre variabler indikeras med datapunktens position i rummet, och en fjärde variabel med dess färg. Sambandsdiagram, spridningsdiagram eller punktdiagram (eng. scatter plot) är en diagramtyp som visar data med punkter i ett kartesiskt koordinatsystem.

Ny!!: Datautvinning och Sambandsdiagram · Se mer »

Sensitivitet

Sensitivitet är ett statistiskt mått som mäter tillförlitligheten hos testmetoder av typen binära klassifikationstest.

Ny!!: Datautvinning och Sensitivitet · Se mer »

Signifikans

Signifikans är inom statistiken ett begrepp för att ange att ett värde i en undersökning avviker från ett hypotetiskt värde eller att det sannolikt inte beror på den statistiska osäkerheten (slumpen).

Ny!!: Datautvinning och Signifikans · Se mer »

Skalnivå

Skalnivå, datanivå och mätskala är synonyma statistiska begrepp som används för att klassificera variabler utifrån vilka typer av svarsalternativ de har.

Ny!!: Datautvinning och Skalnivå · Se mer »

Skriptspråk

Skriptspråk är inom datavetenskap en benämning på "små" högnivåspråk inriktade på specialiserade uppgifter inom redan befintliga miljöer, i motsats till systemspråk, som används för programmering av tillämpningsprogram.

Ny!!: Datautvinning och Skriptspråk · Se mer »

Specificitet

Specificitet är ett statistiskt mått som mäter tillförlitligheten hos testmetoder av typen binära klassifikationstest.

Ny!!: Datautvinning och Specificitet · Se mer »

SPSS

SPSS är ett datorprogram för statistisk analys, men det är också ett företag med flera andra program i portföljen och med kontor på många platser världen över, även i Sverige.

Ny!!: Datautvinning och SPSS · Se mer »

Standardfel

Standardfel eller standardmätosäkerhet är ett mått på osäkerheten i en punktskattning.

Ny!!: Datautvinning och Standardfel · Se mer »

Stödvektormaskin

En stödvektormaskin (eng. support-vector machine) är en typ av statistisk klassificerare, närmare bestämt en generaliserad linjär klassificerare.

Ny!!: Datautvinning och Stödvektormaskin · Se mer »

Subjektbaserad igenkänning

Subjektbaserad igenkänning är en teknik för informationsutvinning som betecknar sökandet efter associationer mellan individer i stora datamängder.

Ny!!: Datautvinning och Subjektbaserad igenkänning · Se mer »

Suddig logik

Suddig logik (engelska fuzzy logic), vanligen kallad oskarp logik, utvecklad av Lotfi Zadeh under 1960- och 70-talen, är en form av logik där lagen om det uteslutna tredje inte gäller.

Ny!!: Datautvinning och Suddig logik · Se mer »

Text mining

Text mining eller text data mining är processen att upptäcka meningsfulla mönster och samband i ostrukturerad information/ostrukturerade data, det vill säga texter.

Ny!!: Datautvinning och Text mining · Se mer »

Trafikanalys (metod)

Se även Trafikanalys (myndighet).

Ny!!: Datautvinning och Trafikanalys (metod) · Se mer »

Träd (datastruktur)

Ett enkelt exempel på ett osorterat träd. Den översta noden med värdet 2 är trädets rotnod. Inom datavetenskap är träd en vanlig datastruktur som ordnar en mängd element hierarkiskt i ett riktat träd där varje nod bara kan ha en båge som leder in till noden.

Ny!!: Datautvinning och Träd (datastruktur) · Se mer »

Upptäckt

tyngden av den undanträngda vätskan. Försättsblad från "Historical and critical information about the life, inventions and writings of Archimedes of Syracuse" av den italienske greven Giammaria Mazzucchelli (1707-1765), publicerad 1737. En upptäckt är det när någon får tidigare okänd kunskap, och det är en uppfinning när någon upptäcker en användningsmöjlighet.

Ny!!: Datautvinning och Upptäckt · Se mer »

Vetenskaplig modell

En vetenskaplig modell är ett försök att systematiskt beskriva ett fenomen i verkligheten.

Ny!!: Datautvinning och Vetenskaplig modell · Se mer »

Visualisering

Visualisering innebär ett åskådliggörande av komplexa, flerdimensionella, sammanhang genom uttryckssätt som anpassats för människans synsinnen.

Ny!!: Datautvinning och Visualisering · Se mer »

Web service

Webbtjänster (Web services) betecknar webbaserade datorprogram som kommunicerar och samarbetar dynamiskt med andra webbtjänster på samma vis som en människa kan surfa till olika webbsidor.

Ny!!: Datautvinning och Web service · Se mer »

XML

Extensible Markup Language, XML, är ett universellt och utbyggbart märkspråk och en förenklad efterträdare till SGML.

Ny!!: Datautvinning och XML · Se mer »

Omdirigerar här:

Data mining, Databrytning, Datamining, Informationsutvinning.

UtgåendeInkommande
Hallå! Vi är på Facebook nu! »