这门课是计算社会科学交叉能力项目提升项目的先修课
基础素养模块2学分 应用实践模块3学分 交叉融合模块2学分
计算+管理/社科/公卫/艺术/创新/经济/社会/政治

“计算社会科学课程实践系统”

  • 数据提取>>数据仓库>>算法库>>智能感知>>智能决策
  • 计算社会科学大数据管理平台+计算社会科学决策支持平台

基础数据源:

  • 新闻全文:全文采集,197个国家和地区,内容含政治、经济等等
  • 领域数据:各类专门领域数据披露网站,建立各国领域数据库,如国家领导库、政党库
  • 知识图谱:量化全球人类社会的知识网络,不仅是物理实体的编目(词条)
  • 社交媒体:推特、facebook等重要的社交媒体数据,长期受到各国政府、学界的高度支持,重点关注三类:每日热搜榜、重点人物、特定主题

算法库建设:

  • 基础人工智能算法:深度神经网络、随机森林、逻辑回归等
  • 集成自主研发的前沿人工智能算法
  • 经济主题数据仓库:面向经济数据构建主题数据仓库——各类数据>>多维多粒度数据表>>多维立方体
  • 宏观经济主题数据库:结构化查询、复杂分析类
  • 可支持的多学科交叉研究

优秀课程实践项目:

  • 全球AI合作态势感知与研制系统
  • AI驱动的养老议题分析–政策图谱、舆情演化与倾向预测
  • AI驱动的民生热点感知与研判——养老主题

引言

大数据的演变:数据库学者的观点

  • VLDB:70年代-80年代
  • Massive Data:90年代后期
  • Big Data: 当前

数据库

  • 文件管理时代:60年代之前
  • 数据库管理系统时代:70年代之后
  • “关系数据模型”、“关系数据库”

数据仓库

  • 信息化发展状况:90年代
    • 大批成熟业务信息系统
    • 信息系统积累海量数据
    • 面向事务处理的OLTP系统
    • 数据资源宝贵未得到充分发挥
    • 发展趋势:数据集中化、业务综合化、管理“扁平化”、决策科学化
    • 目标:以用户为中心、以服务求发展
    • 技术架构:数据源>>数据存储与管理>>OLTP仓库>>前端工具和应用

大数据

  • 定义模糊

人工智能

  • 开篇语:图灵 Can mechinees think?
  • 历史演变:人工智能的探索之路 三次浪潮
    • 第一阶段:推理期 主要成就:机器定理证明——用计算机程序代替人类,让机器通过“逻辑推理”来证明数学定理——科学家认识到仅有逻辑推理能力是不够的——人工智能进入了寒冬——存在难计算、不可计算
    • 第二阶段:知识期 主要成就:专家系统——利用计算机化的知识进行自动推理,从而模仿领域专家解决问题——总结出知识,再“教”给计算机,实在是太难了
    • 第三阶段:群雄逐鹿 符号学派(传统人工智能)、连接学派(仿真大脑结构、神经网络)、行为学派(生物体环境互动,遗传算法、蚁群算法、粒子群优化……)
    • 第四阶段:群龙无首 从人工智能理论研究独立出来,研究不同的具体应用 自然语言处理、计算机听觉、计算机视觉、自动程序设计、博弈……实践检验真理,抛弃纯理论研究
    • 第五阶段:梦醒何处 重要的人工智能研究——深度学习 AlphaGo 4:1 战胜李世石 谁执牛耳——Bengio/Hinton/LeCun
    • 第六阶段:未来已来? 大模型——对社会生活的转变 大模型的顿悟时刻(Emergent Ability)
    • ChatGPT正在:引入推理机制,增强数学以及其他多种问题的推理能力

计算社会科学的诞生

大规模数据的积累等创造的有利条件,使得“计算社会科学”应用而生
“计算社会科学”为人们提供了重要的观察和分析人类社会的复杂行为模式的科研方法

  • 计算+政治
  • 计算+经济
  • 计算+心理

计算社会科学大数据管理平台

  • 全球新闻、社交媒体、知识库、产业数据
  • 数据采集、结构提取、

数据提取>>数据管理>>数据挖掘

  • 计算+新闻舆情 多维立方体设计