2010-03-13 27 views
5

Pido disculpas porque no sé si se trata de una pregunta matemática que pertenece al número mathoverflow o si se trata de una cuestión de informática que pertenece a este.¿La información es un subconjunto de datos?

Dicho esto, creo que entiendo el fundamental difference between data, information, and knowledge. Mi entendimiento es que la información lleva datos y que significa. Una cosa que no tengo claro es si la información es de datos. ¿La información se considera un tipo especial de datos, o es algo completamente diferente?

Respuesta

6

Las palabras data, information y knowlege son conceptos basados ​​en valores utilizados para categorizar, de una manera subjetiva, la "concisión" general y "utilidad" de una información en particular establecido.
Estas palabras no tienen un significado preciso porque están relacionadas con el propósito subyacente y la metodología de procesamiento de la información; En el campo de la teoría de la información, estos no tienen ningún significado en absoluto, porque los tres son lo mismo: una colección de "información" (en el sentido teórico de la información).
Sin embargo, son útiles, en el contexto, para resumir la naturaleza general de un conjunto de información como se explica a continuación de forma vaga.

información es obtuvieron (o, a veces inducido) a partir de datos, pero puede ser más rico, así un producto de limpieza (mediante el cual se han corregido algunos valores) y "simple" (el cual algunos datos irrelevantes se ha eliminado). Entonces, en el sentido de la teoría de conjuntos, Información es no un subconjunto de Datos, pero un conjunto separado [que normalmente se cruza, de alguna manera, con los datos, pero también puede tener elementos propios].

Conocimiento (a veces llamado visión) es otro nivel hacia arriba, se basa en la información y tampoco es una [teoría de conjuntos] subconjunto de información. De hecho, el conocimiento generalmente no tiene referencia directa a los elementos de información, sino que cuenta una "meta historia" sobre la información/datos.

La idea infundada de que a lo largo de los Datos -> Información -> cadena del conocimiento, los niveles más altos son subconjuntos de los inferiores, probablemente se debe al hecho de que hay [normalmente] una reducción del volumen de [ Información de sentido). Pero cualitativamente esta información es diferente, por lo tanto, no hay una relación real de subconjuntos [teoría de conjuntos].

Ejemplo:

  • datos en bruto de bolsa de Wall Street es ... datos
    Un "mar de datos"! Alguien tiene dificultades para encontrar lo que necesita directamente de estos datos. Esta información puede necesitar ser normalizada. Por ejemplo, la información de precios a veces puede expresarse en una cadena de texto con una precisión de 1/32 de dólar, en otros casos los precios pueden aparecer como un entero binario verdadero con una precisión de 1/8 de dólar. Además, el campo que indique, por ejemplo, la identificación del comprador o la identificación del vendedor puede incluir errores tipográficos, y por lo tanto señalar al vendedor/comprador equivocado. etc.

  • Una hoja de cálculo a partir de lo anterior es ... Información
    diversos procedimientos se aplicaron a los datos:
    -Limpieza/corrección de diversos valores
    referenciación -cross (por ejemplo mirando hacia arriba códigos asociados como agregar una columna para mostrar el nombre real de la persona/empresa junto a la columna ID del comprador)
    -mergente cuando se usan registros duplicados pertenecientes al mismo evento (pero digamos de diferentes fuentes) para corroborarse entre sí, pero son también combinado en un solo registro.
    -agregándose: por ejemplo haciendo la suma de todo el valor de transacción para un stock dado (en lugar de mostrar todas las transacciones individuales.
    Todo esto (y luego algunos) convirtieron los datos en Información, es decir, un cuerpo de [IT sense] Información que es fácilmente utilizable, donde se pueden encontrar rápidamente algunos "datos", como por ejemplo la tasa de apertura y cierre de las acciones de IBM el 8 de junio de 2009.
    Tenga en cuenta que, si bien es más conveniente, en parte más exacto/preciso , y también resumido, no hay información real [sentido de TI] allí que no se pudo ubicar o calcular desde el original por procesos relativamente simples (aunque solo sea minuciosos)

  • El informe de un analista financiero puede contener ... conocimiento
    Por ejemplo si el informe indica [ejemplo falso] que cada vez que el precio del petróleo pasa un cierto umbral, el valor del oro comienza a disminuir, pero luego se dispara rápidamente, alrededor del tiempo el precio del café y el té se estabilizan . Este conocimiento particular constituye conocimiento. Este conocimiento puede haber estado oculto solo en los datos, todo el tiempo, pero solo se hizo aparente cuando uno aplicaba un análisis estadístico sofisticado y/o requería la ayuda de un experto humano para encontrar o confirmar dichos patrones.

Por cierto, en el sentido de teoría de la información de la palabra de la Información, "datos", "información" y "Knowlegde" todos contienen información [sentido].
Se podría conseguir posiblemente en la pendiente resbaladiza de afirmar que "A medida que avanzamos en la cadena de la entropía disminuye", pero eso es sólo vagamente cierto porque

  • disminución de la entropía no es directamente o de manera sistemática vinculada a la "utilidad para humana"
    (un ejemplo típico es que un archivo de texto comprimido con menos entropía todavía hay lectura divertida)
  • existe efectivamente una pérdida de información (además de la entropía pérdida)
    (por ejemplo, cuando los datos son agregados al [Información de sentido de TI] sobre los registros individuales se pierden)
  • existe, en particular en el caso de la información -> Knowlege, un cambio en el nivel de Abstration

Un punto final (si no he confundido a todo el mundo sin embargo ...) es la idea de que la cadena es data->info->knowledge efectivamente relativo al uso/propósito previsto de la información [sentido de TI].
ewernli en un comentario a continuación proporciona el ejemplo del corrector ortográfico, es decir, cuando el foco está en la ortografía inglesa, el documento más perspicaz de un genio de Wallstreet es simplemente una cadena de palabras, efectivamente "datos sin procesar", algunos de ellos en necesidad de mejora (a lo largo de la cadena de propósito de la ortografía.
De manera similar, un lingüista que usa miles de artículos de periódico que típicamente (podemos esperar ...) contienen al menos alguna información/conocimiento (en el sentido general), puede considerar estos artículos como datos sin procesar, lo que lo ayudará a crear automáticamente el léxico franco-alemán (esto será información), y mientras trabaja en el proyecto, puede descubrir un cambio semántico sistemático en el uso de palabras comunes entre los dos idiomas, y de ahí obtener una idea de las distintas culturas.

+1

Pero el informe financiero, digamos un archivo ppt, será en sí mismo un dato en bruto, por ejemplo, como hech ecker. El corrector ortográfico generará información, y el ser humano la interpretará y obtendrá conocimiento, p. "Hago siempre este o aquel error". Es meta-circular :) – ewernli

+0

@ewernli. Excelente punto Quise pasar esto por alto, habiendo escrito fácilmente un "manifiesto" posiblemente confuso sobre el tema, pero su comentario me impulsó a discutir brevemente la relatividad del propósito. Gracias ! – mjv

+0

? Sería bueno ver lo que provocó el -1 ... Bien pude haber tergiversado algo, o posiblemente estar totalmente equivocado en otra cosa; sería bueno saber ... – mjv

1

Defina primero la información y los datos, con mucho cuidado.

Lo que es información y qué datos son muy dependientes del contexto. Un ejemplo extremo es una foto suya en una fiesta a la que envía un correo electrónico. Para ti es información, pero para el ISP solo se transmiten los datos.

En ocasiones, solo agregar el contexto correcto cambia los datos a la información.

Por lo tanto, para responder a su pregunta: No, la información no es un subconjunto de datos. Podría ser al menos lo siguiente.

  1. un superconjunto, cuando se agrega contexto

  2. Un subconjunto, aguja en un pajar cuestión

  3. Una función de los datos, por ejemplo, en un resumen

Probablemente haya más situaciones.

+0

Iría aún más lejos y llamaría a la clasificación de datos-información-conocimiento como una filosofía de mala calidad, pretendiendo tener un significado profundo pero carente de significado preciso. Muy a menudo se utiliza para ocultar la falta de comprensión real del procesamiento de la información y la toma de decisiones. – ima

+0

@ima John Smith presenta un excelente punto con respecto a la importancia del contexto en la información de calificación vs. información vs. Sin embargo, y para todos los parientes (al contexto) estos tres conceptos (incluso llamemos a estas categorías, ya que usa la clasificación de palabras) pueden ser, son muy útiles y reales, y no sirven simplemente para ayudar a la gente a falsificar comprensión del procesamiento de la información ... – mjv

+0

Su respuesta es exactamente el tipo de filosofía de mala calidad que tenía en mente. Gracias por dar un ejemplo. – ima

0

La información podría ser datos si tuviera alguna forma de representar el contenido adicional que hace que sea información. Un programa que intenta "entender" el texto escrito puede transformar el texto de entrada en un formato que permita un procesamiento más complejo del significado de ese texto. Este formato transformado es un tipo de datos que representa información, cuando se entiende en el contexto del sistema de procesamiento global. Desde fuera del sistema aparece como datos, mientras que dentro del sistema es la información la que se entiende.

1

Así es como lo veo ...

La información es sucia y cruda. Probablemente tengas demasiado.

... Jason ... 27 ... Denton ... 

La información es la información que necesita, organizada y significativa.

Jason.age=27 
Jason.city=Denton 

El conocimiento es por eso que hay wikis, blogs: hacer un seguimiento de puntos de vista y experiencias. Tenga en cuenta que estos son atributos humanos (y comunitarios). A excepción de tal vez un proyecto de ciencia extraño, no hay computadora en Facebook diciendo a la gente lo que cree en.

+0

Entonces, no, la información NO es un subconjunto de datos. – kiwicptn

1

información es una mejora de los datos:

  • datos es inerte información
  • es accionable

nota de que la información sin datos es simplemente una opinión ;-)

Cuestiones relacionadas