党的(de)十九届五中全会(huì)提(tí)出(chū),到(dào)2035年要把我国建成文化强国。从内容(róng)到形(xíng)式(shì),文化(huà)建设都会受到(dào)技(jì)术发展的影响。习(xí)近平总书记多次强调(diào),宣(xuān)传思(sī)想(xiǎng)文化工作(zuò)要抓好手(shǒu)段创新,其中就(jiù)包括充分运用(yòng)新技(jì)术。大(dà)数据方兴未艾,是信(xìn)息(xī)化发展的新阶段,与云计算、人工智(zhì)能等现代信息技术一(yī)起(qǐ)不断提高社(shè)会生产力,深(shēn)刻(kè)改变着人类生产生(shēng)活。大数据能够为(wéi)繁荣发展文化事业和文化产业提(tí)供有(yǒu)力(lì)支撑。
我们可以(yǐ)从三个维度(dù)把握文化领域(yù)大数(shù)据(jù)。一(yī)是容量(liàng)巨(jù)大的数据。我国各类(lèi)图书馆(guǎn)、博物馆(guǎn)、纪念馆等文化(huà)单位的馆藏资源丰(fēng)富。文(wén)化企业(yè)特别是新兴(xìng)媒体生成大量数据(jù),图片、视频、位置信(xìn)息等非结构(gòu)化数据保持快速增长。第46次《中国互联网络发展状况统计报告》显示,截(jié)至2020年6月,我国网络视频(含(hán)短视频)用户规模(mó)达8.88亿,网络新闻(wén)用户(hù)规(guī)模(mó)为7.25亿,网络音乐(lè)用户规(guī)模为6.39亿。仅这些用户(hù)的行为(wéi)及其分析就会产生海量(liàng)数(shù)据。多源数(shù)据汇聚并持续增加,使(shǐ)文化(huà)领域已经成为大数据应用的(de)典型场景(jǐng)。二是处理(lǐ)大数(shù)据的技术(shù)。海量数据(jù)本身不能(néng)直接带来价值,需(xū)要分析工(gōng)具(jù)使数(shù)据产生意义(yì)。从数据(jù)的标识(shí)、获取(qǔ)到清(qīng)理、存储,再(zài)到管理(lǐ)、处理、分析,初步形成的技术体(tǐ)系不仅能(néng)够从繁多(duō)的数据(jù)中找到有用的部分,还(hái)能够高速(sù)及时地完(wán)成。文化领(lǐng)域里,无论是分(fèn)析(xī)文化需(xū)求,还是实施舆情监测,都需要大数据技术支持。同时,大数据(jù)与网络化、智能化等高度关联(lián),需一体考虑。三是面对大数据所需的思维方式。大(dà)数据将分散的(de)各类数据联结起来,使我们能够以新的视角(jiǎo)理解事物(wù)。《大数据时代(dài)》作(zuò)者维克(kè)托·迈(mài)尔-舍恩伯格和肯尼思·库克(kè)耶曾经提(tí)出,大(dà)数据将在三个方面带来(lái)思维方式的(de)转变:处理全(quán)体(tǐ)样本而不是随(suí)机样本,接受混杂性而(ér)不是精确性(xìng),重视相(xiàng)关关系(xì)而不(bú)是因果(guǒ)关系。但是(shì),不宜(yí)绝对(duì)化理解“重视相(xiàng)关关系而不(bú)是因果关(guān)系”。尤其在文化(huà)领域,常常涉及思想实质(zhì)、态度倾向等分(fèn)析,因果关系不容忽视。谈及(jí)文化领域的(de)大数据(jù),应将这三个方面有机统一起来。只说海量的(de)数据(jù),不谈其分析、运用,或只(zhī)谈思维方式,而对应的却是单一数据源(yuán)的小规模数据(jù)集,都可能影响分析结果。
实践表明,从(cóng)文化产品的创作生产到(dào)文(wén)化建设效果的评(píng)估,大数据都能够发(fā)挥(huī)其新兴(xìng)技(jì)术(shù)的助推(tuī)作用。一是促进文(wén)化产品(pǐn)生产。大数据可(kě)以(yǐ)帮助创作者更加准(zhǔn)确地(dì)了解(jiě)受众的兴趣和行为习惯,细致到掌握受众观看视频、影视(shì)剧时是否快进、重播的程度。大数据分析结(jié)果还可以提(tí)升(shēng)公共文化(huà)服务水平,促进文化(huà)企业转型升级(jí)、高质量发展,优(yōu)化文化产业园区布(bù)局。二是掌握舆情舆(yú)论、思想观念(niàn)变化情(qíng)况。及时(shí)发(fā)现苗头性(xìng)、倾向性(xìng)问题,增强(qiáng)应对(duì)的主动性,是(shì)宣传(chuán)思想(xiǎng)文化工(gōng)作的重要内容(róng)。大数据的优势正(zhèng)是分(fèn)析趋势、开(kāi)展预测预警,提供技术支撑。三是提(tí)高社会文明程(chéng)度。大(dà)数据分(fèn)析可以及(jí)时发现各(gè)种(zhǒng)不文明(míng)行(háng)为,使思(sī)想教育(yù)和道德建设更具有(yǒu)针(zhēn)对(duì)性。四是评(píng)价文(wén)化产品。大数据以全样本、多信(xìn)源等优(yōu)势,弥补传(chuán)统方法(fǎ)存在的误差,提高结果(guǒ)的可(kě)信(xìn)度,甚至可依托巨量数据(jù)提供实时动态的评价。
大数据(jù)在文化建设中(zhōng)的应用(yòng)也面临难(nán)题。从技术层面看,文化领域有(yǒu)些内容是难以量化的,或者存(cún)在(zài)数据不完整的可能。比(bǐ)如,与(yǔ)日常(cháng)用品不同(tóng),文化产品(pǐn)所具(jù)有的思想性,不(bú)易完全制成数据。有(yǒu)些文化产品具有独创性、唯一性,以(yǐ)通用性的数据去重塑(sù)有难度,非物质文化遗(yí)产(chǎn)的传承也(yě)面临相似(sì)的问题。从人文和伦理(lǐ)层面(miàn)看,部分文化产(chǎn)品存在着(zhe)依靠大数据分析结果一味迎合受众需求而弱化(huà)正确价值(zhí)引导(dǎo)的可能(néng)性,受(shòu)众也可能(néng)因此更加注重即时的短(duǎn)期(qī)需求而忽(hū)视更高的价值追求。过度依赖大数据(jù)进行创作,也会影响人(rén)作为(wéi)文化发展主体的能动性。从(cóng)法治层面看,大数据能够(gòu)使原本模糊的隐匿的(de)信(xìn)息被“去匿名化”,存(cún)在侵犯隐私权、个人信息权的可(kě)能性;依托大数据形成的文化(huà)产(chǎn)品,权益(yì)归(guī)属(shǔ)和分配有(yǒu)时不易确(què)定。
促进(jìn)大数(shù)据(jù)在文(wén)化(huà)领域合(hé)理(lǐ)运用,应做到以下几(jǐ)点(diǎn)。
始终把社会效益(yì)放在(zài)首(shǒu)位。文化建设有其特殊性,必须把握好社会效益和经济效益的关系、意识形态属(shǔ)性和产业属性的(de)关系,始终坚持社会主(zhǔ)义先进文化前(qián)进方向,把增进人民福祉作为文化领(lǐng)域应用大数据的出(chū)发点和(hé)落脚点(diǎn),用(yòng)主(zhǔ)流价(jià)值导向驾驭“算法”,防止单纯用大数据(jù)分析结果(guǒ)做依据。
调动各方(fāng)面的(de)积极性。典型意义的大数据是(shì)跨部门(mén)、跨组织甚至跨(kuà)境的,技术研发和应用不是个人或(huò)单一组织机构能(néng)够实现的。政府应做好文化领域大数据战(zhàn)略规(guī)划(huá),实现与国家大数(shù)据战(zhàn)略的有机衔接(jiē),提高文(wén)化事业(yè)单位和文化企业融入大数据(jù)战略的意识(shí)和能力,与民生(shēng)等其他领域大(dà)数据充分结合,防止(zhǐ)以(yǐ)大数(shù)据为名一哄而上、浪费资源。围绕大数据生命全周期,加(jiā)强政府与企业、组织的合(hé)作,推动大数据技术生态系统(tǒng)的(de)构建和完善,依法实(shí)现(xiàn)开放数据(jù),加(jiā)快培养文(wén)化领域应(yīng)用大数(shù)据所需的复合型人(rén)才。
加强(qiáng)大(dà)数据应用的法(fǎ)治(zhì)保障。坚持安全可(kě)控和创新发(fā)展并(bìng)重,以高位阶(jiē)法律(lǜ)规范大数(shù)据的收集(jí)、存储和应用。文化领域大(dà)数据分析对象有思想(xiǎng)性、艺术性,又有技(jì)术的前沿性,还涉及多个环节(jiē),应完善大数据治(zhì)理体系,明晰知识产权(quán),依法(fǎ)管(guǎn)理(lǐ)数据跨境流动。在我国《民法典(diǎn)》等法律(lǜ)明(míng)确保护(hù)个人(rén)信息的基础上,公法(fǎ)和私法并重,既维(wéi)护个人信息(xī)权益,又促进数据共享和(hé)使用。
丰富文化(huà)产品(pǐn)和业态。以大数据助力(lì)把握舆论引(yǐn)导的时、度、效。一方面,倡(chàng)导媒体开(kāi)发制作(zuò)基于大数(shù)据的(de)数据新闻(wén),生动具体地表(biǎo)现社会(huì)主义核心价值观,宣传中国(guó)特色(sè)社(shè)会主义发(fā)展的(de)成就,讲好中国故事;另一方面,收集整(zhěng)理有关数据,及时批(pī)驳各种错误观念。充分考虑群众不同(tóng)的文化需求,以高(gāo)质(zhì)量文化供(gòng)给增强群众的文(wén)化获(huò)得感、幸福感(gǎn)。