¿Software para producir gráficos para conjuntos de datos muy grandes?

4

Estoy buscando producir gráficos a partir de algunos conjuntos de datos muy grandes. Para comenzar, tengo un conjunto de datos con 40 series diferentes, cada una con 5000 muestras de las que me gustaría crear un gráfico de líneas, con cada serie representada por una línea en el gráfico.

Los números se ahogan después de unas 450 muestras. Excel funciona un poco mejor y llega a 1000 muestras. Pero ninguno de ellos puede manejar el conjunto completo de muestras en todas las series.

¿Hay un mejor software que pueda usar para generar la trama? ¿Manejaría OmniGraphSketcher este tamaño de conjunto de datos? ¿Qué hay de R ? O gnuplot ?

Se prefiere algo con una curva de aprendizaje más fácil (es decir, estoy evitando gnuplot como la plaga hasta que quede claro que es mi única esperanza ...) y no me molesta si no se puede hacer la trama. en tiempo real. No me importa configurar las cosas y luego esperar a que se produzca una imagen de la trama en el fondo. Puntos de bonificación si puede producir un resultado de la trama que sea tan fácil para los ojos como los números producirán para conjuntos de datos más pequeños.

    
pregunta Ian C. 04.04.2011 - 21:47

2 respuestas

5

Supongo que te refieres a 5000 observaciones. R funcionará y RStudio hará que uses R con un poco más de GUI que la aplicación nativa. Las soluciones comerciales como Stata, que tiene una curva de aprendizaje suave, en comparación especialmente con R, también funcionarán ese tipo de muestra sin ninguna dificultad (según los estándares estadísticos, 5000 observaciones son un conjunto de datos relativamente pequeño).

La curva de aprendizaje será importante si quieres ir más allá de una simple trama; de lo contrario, un vistazo rápido a la documentación para los gráficos de líneas debería ser suficiente (para R, consulte allí y there , por ejemplo). HTH!

    
respondido por el Fr. 05.04.2011 - 01:16
0

R definitivamente manejará ese tamaño de datos por ti. Si administra conjuntos de datos de forma rutinaria, definitivamente recomendaría aprenderlo.

Atajo para ofrecerte la sugerencia OpenOffice.org (también conocida como OOo).

Me sorprende, sin embargo, que Excel se bloquee en ti. Usé Excel (en Windows) recientemente para gestionar 8 series de 27 000 muestras sin problemas, produciendo gráficos complejos en fracciones de segundo.

¿En qué punto fallan estas dos aplicaciones? ¿Es, por casualidad, en el momento en que importan su conjunto de datos, o se molestan cuando intenta compilarlos en un gráfico? No sé sobre Números, pero Excel debería poder manejar cientos de miles de filas sin perder un paso.

    
respondido por el msanford 04.04.2011 - 23:09

Lea otras preguntas en las etiquetas