*   >> Læs Uddannelse artikler >> science >> computers

Arrangeret Detaljer Vs Ustruktureret Data

De fleste virksomheder identificere alle data som enten strukturerede eller ustrukturerede. Lige som navnet antyder, bliver strukturerede data fordele fra struktureret og sat op til hurtige henvendelser via relativt simple udseende for teknikker. Ustrukturerede data har ingen indbygget ramme (selv om det kan være "løst strukturerede"), og ofte modsiger indsats for at skabe enkle udseende til motorer kigge efter. Strukturerede data giver sig til simple forskning ved fordel af sin virksomhed og homogen information.

For eksempel mange excel regneark og alle relationelle mapper, som begge er retrieveable efter type og kan derfor hurtigt eksisterende oplysninger til den enkelte. Alle detaljer er proportional med hinanden og relationelle datakilde kontrol teknikker (RDBMS) er forbedret til respons individuelle undersøgelser på detaljerne. Ustrukturerede data indeholder lidt eller ingen velkendte rammer, som regel på grund af de divergerende karakteristika detaljerne. Corporate samfund rapporterer, at 80% af alle nyttige selskab datasæt i en ustruktureret tilstand. En e-mail giver et eksempel.

Mens oplysninger sommetider er struktureret inden for en datakilde, de virkelige artikler i konceptet er ikke. Det er muligt at arrangere en koordinator af oplysninger fra Emailer, data, etc., men det er ikke muligt at udføre et spørgsmål om deres artikler. Alle ustrukturerede data kan kategoriseres som enten bitmap ting eller tekstlige ting. Bitmap tingene inddrage alle data, der ikke er centreret i terminologi såsom video, lyd og billeder, mens tekstlige tingene er i henhold til offentliggjorte terminologi generelt fundet i konceptet brand datafiler og informationer, blandt andre.

At være rimelige, udtrykket "ustrukturerede data" kan være noget af en misvisende, da meget af det kan faktisk være magen til "semi-strukturerede data", der dog ikke hurtigt arbejde med en RDBMS. Forhindringen udforskning ustruktureret datasæt både i sin prospektivt for størrelse og dets underskud på velkendte rammer. Databaseprogrammer kan ikke eksisterende detaljerne i nogen væsentlig form, så de ønsker at gøre ustrukturerede data brugbare førte til systemer som Hadoop og Cloudera. "Big data" og ustrukturerede data er ikke knyttet betingelser, men Big Detaljer er næsten altid ustruktureret.

Hvis en virksomhed som Google eller Myspace har brug for en måde at evaluere individuelle surfing omkring rutiner eller fremme information, så de bruger en tildelt datakilde kontrolsystem (DDBMS) at g

Page   <<       [1] [2] >>
Copyright © 2008 - 2016 Læs Uddannelse artikler,https://uddannelse.nmjjxx.com All rights reserved.