Calls Technologies ‘Big Data’ for the Modern Social Sciences and Humanities

 
PIIS004287440001353-3-1
DOI10.31857/S004287440001353-3
Publication type Article
Status Published
Authors
Occupation: Associate professor
Affiliation: Russian Academy of National Economy and Public Administration under the President of the Russian Federation
Address: Russian Federation, Vologda
Journal nameVoprosy filosofii
EditionIssue 9
Pages50-59
Abstract

Scientific interest in the emergence of new techniques for working with intensive data aka «Big Data» technologies generates a wide range of new research practices in almost every modern scientific discipline. The purpose of the article is to analyze the changes associated with the development of similar research practices in the social sciences and humanities. In the article presented two interrelated contexts for considering the «Big Data» technologies: industrial and scientific. And also various kinds of definitions of "Big Data" technologies are proposed: with a quantitative focus (dimensions, properties, volumes, structure or composition of data); with an emphasis on the process and cognitive-oriented. The definition of the «Big Data» technologies in the perspectives of studying the social movement, the behavior of people and the public nature of events is highlighted. In this group of definitions the important role is assigned to the derivative of «Big Data» concept of «datafication». The datafication is presented as a modern technological macrotrend on transformation of social actions into online quantitative data, interconnected with such modern technological macrotrends as digitalization, sensorization and softwarization.

The main changes were found in the form of calls «Big Data» technologies for modern social sciences and humanities at the cognitive, epistemological, methodological, institutional and ethical level of knowing. Special attention is paid to such manifestations dataism in scientific activities as exploratory science, discovery science, hypothesis-free science, data driver science, datacentric science, empiricist epistemology and science Big Data.

Keywordstechnology «Big Data», datafication, sensorization, softwarization, dataism, exploratory science, discovery science, hypothesis-free science, data driver science, datacentric science, empiricist epistemology, science Big Data
Received19.10.2018
Publication date23.10.2018
Number of characters29544
Cite  
100 rub.
When subscribing to an article or issue, the user can download PDF, evaluate the publication or contact the author. Need to register.
Размещенный ниже текст является ознакомительной версией и может не соответствовать печатной

Table of contents

1

Если у человека нет данных, он не существует.

Дж. Боукер. Практики памяти в науках

2

По мнению Л. Флориди, человечество накопило 180 экзабайт данных и информации от момента возникновения письменности до 2006 г. С 2006 до 2011 гг. уже произведено 1600 Экзабайт. Эта цифра увеличивается четырехкратно приблизительно каждые три года [Floridi 2012]. Каждый день создается 2,5 нониллиона (1030) байт данных, это приводит к тому, что 90% данных в мире создается за последние два года.

3

Термин «большие данные» относится к огромным, различным, сложным, продольным и/или распределенным наборам данных, сгенерированных и/или полученных от всех иных цифровых источников, доступных в настоящем и будущем времени. Обычно выделяют три основных источника «больших данных» [Kitchin 2014b]. Во-первых, сбор данных от управляемого наблюдения. Во-вторых, автоматизированные формы производства данных, включающих в себя полученные в результате работы цифровых устройств, сенсоров, сканеров [Журавлева 2012]. И, в-третьих, генерация волонтерских данных, включающих в себя транзакции, социальные медиа (посты, фото, видео), «обратное наблюдение»1, проекты краудсорсинга2 и т.п.

4

Традиционно технологии «больших данных» рассматриваются в двух взаимосвязанных контекстах: индустриальном и научном. В первом случае как результат огромных инвестиций, которые потребуются для их полезного использования. Международная корпорация данных IDC опубликовала исследование, согласно которому рынок технологий «больших данных» и относящейся к ним аналитики в 2016 г. составит $23,8 млрд, а к 2019 г. достигнет $48,6 млрд [Foster 2016]. А во втором случае «большие данные» являются источником потенциального интереса всех ученых, работающих над одним и тем же феноменом. При этом научные институты увеличивают попытки по совершенствованию «практик памяти» – техник и технологий, направленных на «сохранение и восстановление фактов» [Bowker 2006].

5

Существует предположение, что истоки технологий «больших данных» прослеживаются в проектах «большой науки», которые имели огромный недостаток целевых теоретических драйверов. Этот фокус был замещен различными мотивациями по сбору данных о мире. Несомненно, ученые используют теорию, которая формирует их методологию и интерпретативные структуры, но тем не менее мотивацией для объединенного проекта было не тестирование гипотез или теории, а сбор данных об изучаемом явлении [Aronova… 2010].

6

В целом, проанализировав источники по интересующему вопросу, можно выделить несколько групп определений технологий «больших данных». Слово «data» в переводе с латинского языка означает данность, т.е. факт или то, что дано. По латинскому смыслу слова «данные» являются объектами, данными в противовес «фактам», объектам созданным. «Мы столкнулись тем не менее, – замечает Х.Д. Райнбергер, – с затруднительным положением относительно того, что в дискурсе современных наук смысл этих слов становится диаметрально противоположным. Данные рассматриваются как нечто, созданное инструментами и произведенные создателем. Данные допускают генерирование, они могут быть сохранены и восстановлены. В противоположность данным, ‘факты’ допускаются и берутся как нечто данное. Они являются твердыми объектами. Они просто есть» [Rheinberger 2011]. Также термин «данные» означает точное и объективное документирование для начала изучения возможности какой-либо сущности или процесса.

Number of purchasers: 0, views: 2153

Readers community rating: votes 0

1. Adkins, Lisa, Lury, Celia (2009) ‘What is the empirical?’, European Journal of Social Theory, special issue, № 12, pp. 5–20.

2. Allen, John F. (2001) ‘In Silico Veritas. Data-Mining and Automated Discovery: The Truth Is in There’, EMBO Reports, № 2, pp. 542–544.

3. Anderson, Chris (2008) ‘The end of theory: The data deluge makes the scientific method obsolete’, Wired, Vol. 16 (7), pp. 108–109.

4. Aronova, Elena, Baker, Karen S., Oreskes, Naomi (2010) ‘Big science and big data in biology: From the International Geophysical Year through the International Biological Program to the Long Term Ecological Research (LTER) Network, 1957– Present’, Historical Studies in the Natural Sciences, 40, pp. 183–224.

5. Bowker, Geoffrey C. (2006) Memory Practices in the Sciences, MIT Press, Cambridge, MA.

6. Brey, Philip, Søraker, Johny H. (2009) ‘Philosophy of Computing and Information Technology’, Philosophy of Technology and Engineering Sciences. Vol. 14 of the Handbook for Philosophy of Science, ed. A. Meijer, gen. ed. D. Gabbay, P. Thagard and J. Woods, Elsevier.

7. Brooks, David (2013) ‘The philosophy of data’, New York Times, 04.02.2013 http://www.nytimes.com/2013/02/05/opinion/brooks-the-philosophy-of-data.html

8. Clough, Patricia, Ticineto, Karen, Gregory, Benjamin, Haber, Scannell, Joshua (2014) The Datalogical Turn in Nonrepresentational Methodologies: Re-Envisioning Research, ed. Phillip Vannini, Taylor & Francis, Oxford, pp. 182–206.

9. Floridi, Luciano (2012) ‘Big Data and their epistemological challenge’, Philosophy and Technology, 25 (4), pp. 435–437.

10. Foster, Allan (2016) ‘Initiatives’, Business Information Review, № 33, pp. 54–69.

11. Franklin, Laura R. (2005) ‘Exploratory Experiments’, Philosophy of Science, № 72, pp. 888–899.

12. Gould, Peter (1981) ‘Letting the data speak for themselves’, Annals of the Association of American Geographers, № 71 (2), pp. 166–76.

13. Hallam, Stevens (2013) Life Out of Sequence: A Data-Driven History of Bioinformatics, The University of Chicago Press, Chicago and London.

14. Hunter, David J., Kraft, Peter (2007) ‘Drinking from the fire hose: Statistical issues in genome wide association studies’, N EnglJ Med, № 357, pp. 436–439.

15. Ioannidis, John P.A., Ntzani, Evangelia E., Trikalinos, Thomas A., Contopoulos-Ioannidis, Despina G. (2001) ‘Replication validity of genetic association studies’, Nat Genet, № 29, pp. 306–309.

16. Kitchin, Rob (2013) Review of Software Takes Command by Lev Manovich (Bloomsbury, 2013), https://www.goodreads.com/author_blog_posts/6010103-review-of-software-takes-command-by-lev-manovich-bloomsbury-2013.

17. Kitchin, Rob (2014a) The Data Revolution: Big Data, Open Data, Data Infrastructures and Their Consequences, Sage, London.

18. Kitchin, Rob (2014b) ‘Big data, new epistemologies and paradigm shifts’, Big Data and Society, № 1, pp. 1–12.

19. Leonelli, Sabina (2014) ‘Data Interpretation in the Digital Age’, Perspectives on Science, № 22 (3), pp. 397–417.

20. Lingen, Frank Van (2013) A Software Aware Society Driven by Sensors, Analytics and APIs, 21.11.2013 http://blogs.cisco.com/sp/a-software-aware-society-driven-by-sensors-analytics-and-apis-2/.

21. Mayer-Schönberger, Viktor, Cukier, Kenneth (2013) Big Data. A Revolution That Will Transform How We Live, Work, and Think, Houghton Mifflin, Harcourt (Russian Translation).

22. Pietsch, Wolfgang (2013) ‘Big Data – The New Science of Complexity’, 6th Munich-Sydney-Tilburg Conference on Models and Decisions (Munich; 10-12 April 2013), http://philsci-archive.pitt.edu/9944/

23. Rheinberger, Hans-Jörg (2011) ‘Infra-experimentality: From Traces to Data, from Data to Patterning Facts’, History of Science, № 49 (3), pp. 337–348.

24. Richards, Neil M., Jonathan, H. King (2013) ‘Three Paradoxes of Big Data’, Stanford Law Review Online, № 41, pp. 41–46.

25. Rodgers, Richard (2009) The End of the Virtual: Digital Methods, Media, Amsterdam University Press, рр. 1−25.

26. Ruppert, Evelyn (2013) ‘Rethinking Empirical Social Sciences’, Dialogues in Human Geography, № 3 (3), pp. 268−273.

27. Ruppert, Evelyn, Law, John, Savage, Mike (2013) ‘Reassembling Social Science Methods: The Challenge of Digital Devices’, Theory, Culture & Society, Special Issue on The Social Life of Methods, № 30 (4), pp. 22−46.

28. Savage, Mike, Burrows, Roger (2007) ‘The Coming Crisis of Empirical Sociology’, Sociology, № 41, рр. 885–899.

29. Szalay, Alexander, Gray, Jim (2006) 2020 ‘Computing: Science in an exponential world’, Nature, Vol. 440, рр. 413–414.

30. Hey, Tony, Tansley, Stewart, Tolle, Kristin ed. (2009) The fourth paradigm: data-intensive scientific discover, Microsoft Research, Redmond, Washington.

31. Dijck, José van (2014) ‘Datafication, dataism and dataveillance: Big Data between scientific paradigm and ideology’, Washington Historical Quarterly, № 2 (12), pp. 197−208.

32. Weinberger, David (2011) Too big to know: Rethinking knowledge now that the facts aren’t the facts, experts are everywhere, and the smartest person in the room is the room, Basic Books, New York.

33. Zhuravleva, Elena Yu. (2012) ‘Epistemic status of digital data in modern scientific research’, Voprosy Filosofii, Vol. 2 (2012), рр. 113–123 (in Russian).

Система Orphus

Loading...
Up