Sign In

Identifier

Event

Language

Presentation type

Topic it belongs to

Subtopic it belongs to

Title of the presentation (use both uppercase and lowercase letters)

Presentation abstract

La investigación en el área de Ciencias Sociales se encuentra transversalizada por la dinámica de las tecnologías de la comunicación e información; en ese orden la minería de texto brinda al investigador social la opción de acceder a ingente información que reposa en las plataformas big data. El objetivo de esta investigación fue explorar y caracterizar los principales repositorios de big data en el área de las Ciencias Sociales disponibles año 2021. Investigación de diseño no experimental, exploratoria y descriptiva. La población estuvo constituida por 110 big data localizados por el motor de búsqueda para conjuntos de datos (datasets) de Google. Las categorías utilizadas en la búsqueda fueron “ciencias sociales”, “plataformas big data”, “repositorios big data”, “corporaciones big data”. Los resultados indica que los repositorios y plataformas más importantes de big data se encuentran centralizados por el sector privado localizado en empresas de EUU fundamentalmente. Las plataformas de libre acceso, constituyen importantes fuentes de información en las diversas ramas de las Ciencia Social. Los datos disponibles en la big data en su mayoría constituyen datos no estructurados, que demandan del ejercicio transcdisciplinario de la metaheurística, en consecuencia, el investigador de lo social requiere el desarrollo de competencias que posibilite el ejercicio dialógico para con los especialistas en ciencias de la computación, donde la aplicación del principio recursivo de la complejidad devenga en la construcción y aplicación de metodologías de investigación que respondan a los objetivos del investigador social.

Long abstract of your presentation

Introducción: La investigación en el área de Ciencias Sociales se encuentra transversalizada por la dinámica de las tecnologías de la comunicación e informaciónen ese orden la minería de texto brinda al investigador social la opción de acceder a las big data, donde reposan datos con la potencialidad de transformarse en información valiosa, en tanto se apliquen técnicas de minería de datos donde el estudioso trace la ruta delimitando categorías, tiempo y espacio. La replicación de la investigación en ciencias sociales, fundamentalmente en las áreas donde el análisis de contenido es esencial, corresponde a uno de los grandes aportes de la minería de datos, que, aunado a la fenomenología y la teoría social, posibilita la construcción del conocimiento fundamentado en análisis macro en ejercicio del principio recursivo de la complejidad. Objetivo: Explorar y caracterizar los principales repositorios de big data en el área de las Ciencias Sociales disponibles año 2021. Metodología: Investigación de diseño no experimental, exploratoria y descriptiva. La población estuvo constituida por 110 big data localizados por el motor de búsqueda para conjuntos de datos (datasets) de Google. La muestra corresponde a los 10 principales big data, contentivos de datos que potencialmente pueden minarse y brindar información para la investigación en el área de ciencias sociales. Las big data de la muestra contienen información, de diferentes áreas del conocimiento, con la singularidad de constituir los más importantes repositorios en el área de las Ciencias Sociales.  Las categorías utilizadas en la búsqueda fueron “ciencias sociales”, “plataformas big data”, “repositorios big data”, “corporaciones big data”. Resultados: Indican que los repositorios y plataformas más importantes de big data se encuentran centralizados por el sector privado localizado en empresas de EUU fundamentalmente. Las plataformas de libre acceso, constituyen importantes fuentes de información en las diversas ramas de las Ciencia Social.  Los datos disponibles en la big data en su mayoría constituyen datos no estructurados, que demandan del ejercicio transcdisciplinario de la metaheurística, en consecuencia, el investigador de lo social requiere el desarrollo de competencias que posibilite el ejercicio dialógico para con los especialistas en ciencias de la computación, donde la aplicación del principio recursivo de la complejidad devenga en la construcción y aplicación de metodologías de investigación que respondan a los objetivos del investigador social.

Bibliografía

  • Angus, R. W. (2019). Problemistic Search Distance and Entrepreneurial Performance. Strategic Management Journal. doi:10.1002/smj.3068
  • Angwin, J., Larson, J., Mattu, S.  & Kirchner, L. (2016). Machine Bias. ProPublicahttps://goo.gl/8MAfhK 
  • Antons, D., & Breidbach, C. F. (2017). Big Data, Big Insights? Advancing Service Innovation and Design With Machine Learning. Journal of Service Research, 21(1), 17–39. doi:10.1177/1094670517738373
  • Antons, D., Joshi, A. M., & Salge, T. O. (2018). Content, Contribution, and Knowledge Consumption: Uncovering Hidden Topic Structure and Rhetorical Signals in Scientific Texts. Journal of Management, 014920631877461. doi:10.1177/0149206318774619.
  • Boullier, D. (2016). Big Data challenges for the social sciences: from society and opinion to replications. Cornel University. https://arxiv.org/abs/1607.05034 
  • Canadá, Goberment (2021). Open Data for Development. https://www.od4d.net/,
  • Data Portal (2021). A Comprehensive List of Open Data Portals from Around the World. Data Portal.  https://dataportals.org/search
  • Digital Guide (12 de febrero 2021). Application Programming Interface (API): cómo se comunican las aplicaciones. Digital Guide. https://www.ionos.es/digitalguide/paginas-web/desarrollo-web/application-programming-interface-api/
  • Elite Data Sciences. ( 10 de febrero 2021). Datasets for Data Science and Machine Learning. Data Sets. Datasets for Data Science and Machine Learning (elitedatascience.com)
  • Espinosa, J.J. (2020). Aplicación de metodología CRISP-DM para segmentación geográfica de una base de datos pública. Ingeniería, investigación y tecnología21(1), e00008. http://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S1405-77432020000100008
  • Gartner (2021). Gartner Glosary.  https://www.gartner.com/en/information-technology/glossary/big-data
  • George, G., Osinga, E. C., Lavie, D., & Scott, B. A. (2016). Big Data and Data Science Methods for Management Research. Academy of Management Journal, 59(5), 1493–1507. doi:10.5465/amj.2016.4005 
  • Hong Kong Baptiste University & Library. (2021) Data across countries. https://hkbu.libguides.com/data-sources
  • Huber, S., Wiemer, H., Schneider, D., & Ihlenfeldt, S. (2019). DMME: Data mining methodology for engineering applications – a holistic extension to the CRISP-DM model. Procedia CIRP, 79, 403–408. doi:10.1016/j.procir.2019.02.106 
  • Humphreys, A., & Wang, R. J.-H. (2017). Automated Text Analysis for Consumer Research. Journal of Consumer Research, 44 (6), 1274–1306. doi:10.1093/jcr/ucx104 
  • ICPSR Sharing data to advance Science (2021). Home. https://www.icpsr.umich.edu/web/pages/
  • Ingersoll, G.S., Morton, T.S. & Farris, A.L. (2013). Taming text: How find, organize, and manipulate it. Shelter Island, NY: Manning Publications Co.
  • Insights Association (2020). Research & data analytics industry. Top 50 Report US, 2020. https://www.insightsassociation.org/sites/default/files/misc_files/ia_top_50_report_us_2020_final_2.pdf
  • Kagle (2021). Datasets. https://www.kaggle.com/datasets
  • Kilroy, J. (2021). 100+ of the Best Free Data Sources For Your Next Project. Colum Five. https://www.columnfivemedia.com/100-best-free-data-sources-infographic
  • Kobayashi, V. B., Mol, S. T., Berkers, H. A., Kismihók, G., & Den Hartog, D. N. (2017). Text Classification for Organizational Researchers. Organizational Research Methods, 21(3), 766–799. doi:10.1177/1094428117719322
  • Laney. (2001). 3-D Data Management: Controlling Data Volume, Velocity and Variety. META Group Research Note. https://www.scirp.org/(S(351jmbntvnsjt1aadkposzje))/reference/ReferencesPapers.aspx?ReferenceID=1611280
  • Lee, J. & Kim, C. & Shin, J., (2017). Technology opportunity discovery to R&D planning: Key technological performance analysisTechnological Forecasting and Social Change, Elsevier, 119(C), 53-6. DOI: 10.1016/j.techfore.2017.03.011
  • Leonelli, S. & Carrigan, M. (2015). Sabina Leonelli : What constitutes trustworthy data changes across time and space. lse: Impact of Social Sciences Bloghttp://blogs.lse.ac.uk/impactofsocialsciences/2015/01/19/philosophy-of-data-science-series-sabina-leonelli/
  • Lopes, C. & Bailur, S. 2018. Gender Equality and Big Data. NY: UN Women. https://undg.org/wp-content/uploads/2018/02/ Gender-equality-and-big-data-en.pdf.
  • Martínez, F., Contreras, L., Ferri, C., Hernandez, J., Kull, M., Lachiche, N., Flach, P. A. (2019). CRISP-DM Twenty Years Later: From Data Mining Processes to Data Science Trajectories. IEEE Transactions on Knowledge and Data Engineering, 1 (1). doi:10.1109/tkde.2019.2962680 
  • Masley, J. (1998). Big Data and the Next Wave of InfraStress. Computer Systems Laboratory Colloquium February 25, Silicon Valley.  https://web.stanford.edu/class/ee380/9798win/lect08.html
  • Mayer, V., & Kenneth, C.(2014). Big Data: A Revolution that will Transform how we Live, Work, and ThinkNueva York: Houghton Mifflin Harcourt.
  • Meneses, M. E. (2018). Grandes datos, grandes desafíos para las ciencias sociales. Revista mexicana de sociología80(2), 415-444. https://doi.org/10.22201/iis.01882503p.2018.2.57723
  • Metcalf, J., & Crawford, K.(2016). Where are human subjects in Big Data research? The emerging ethics divide. Big Data & Society, 3(1), 1-14. doi: https://doi.org/10.1177/2053951716650211
  • Moehrle, M. G., Wustmans, M., & Gerken, J. M. (2017). How business methods accompany technological innovations - a case study using semantic patent analysis and a novel informetric measure. R&D Management, 48(3), 331–342. doi:10.1111/radm.12307
  • Nambisan, S., Lyytinen, K.,   Majchrzak, A., & Song, M. (2017).  Digital innovation management: reinventing innovation management research in a digital worl. MIS Quartely, 41 (1), 223-238. 10.25300/MISQ/2017/41:1.03
  • Nature (2021). Scientific Data.  https://www.nature.com/sdata/policies/repositories
  • Open Data Institute (2021). We want a world where data works for everyone.  https://theodi.org/
  • Oussous, A., Benjelloun, F.-Z., Ait Lahcen, A., & Belfkih, S. (2017). Big Data technologies: A survey. Journal of King Saud University - Computer and Information Sciences. doi:10.1016/j.jksuci.2017.06.001
  • Paterson, M., & Mc Donagh, M. (2018). Data Protection in an era of Big Data: The challenges posed by big personal data. Monash University Law Review44(1), 1-31.  https://www.monash.edu/__data/assets/pdf_file/0009/1593630/Paterson-and-McDonagh.pdf
  • Pennebaker, J.W., Boyd, R.L., Jordan, K. & Blackburn (2015).The Development and Psychometric Properties of LIWC2015. Austin, TX: Texas University. https://repositories.lib.utexas.edu/handle/2152/31333
  • Pew Research Center (2021).  Download Datasets. https://www.pewresearch.org/download-datasets/
  • Portillo, J. (2016). Planos de realidad, identidad virtual y discurso en las redes sociales. Logos (La Serena)26(1), 51-63. Doi: http://dx.doi.org/10.15443/RL2604 
  • Pyle, D. (2003). Business Modeling and Data Mining.  Burlington, Massachusetts:  Morgan Kaufmann Publishers.
  • Raconteur (2021). Content for business decision-makers. https://www.raconteur.net/
  • Rana, A.N.. (2020). Leveraging Big Data to Advance Gender EqualityEMCompass (86). https://openknowledge.worldbank.org/handle/10986/34308
  • SAS Enterprise Miner. (2021). Reveal valuable insights with powerful data mining software. SAS Enterprise Miner. https://www.sas.com/en_th/software/enterprise-miner.html
  • SAS Institute. (1998). Data Mining and the Case for Sampling. https://sceweb.uhcl.edu/boetticher/ML_DataMining/SAS-SEMMA.pd
  • Sheldon, P., & Bryant, K. (2016). Instagram: Motives for its use and relationship to narcissism and contextual age. Computers in Human Behavior, 58, 89-97. Recuperado de: https://www.researchgate.net/publication/289122439_Instagram_Motives_for_its_use_and_relationship_to_narcissism_and_contextual_age
  • UN Data (2021). A World of information.  https://data.un.org/
  • UN Global Pulse (2021). Big Data and Artificial Intelligence. https://www.unglobalpulse.org/ 
  • Ureña, R.(2019). Autoridad algorítmica: ¿cómo empezar a pensar la protección de los derechos humanos en la era del “big data”? Latin American Law Review, (2), 99-124. doi: https://doi.org/10.29263/lar02.2019.05
  • Web World Wide Foundation (2021). Open Data Barometer.  https://opendatabarometer.org/

Keywords (use both uppercase and lowercase letters)

Main author information

Israel Barrutia Barreto (Peru)
INNOVA SCIENTIFIC (Peru) 5805
Scientific production

Co-authors information

Juan José Danielli Rocca (Peru)
Universidad Nacional Mayor de San Marcos (Peru) 5807
Scientific production
Renzo Antonio Seminario Córdova (Peru)
INNOVA SCIENTIFIC (Peru) 5808
Scientific production

Status:

Approved