精华内容
下载资源
问答
  • 相约钱塘江畔,研讨经济计量Stata & Python 实证前沿与爬虫分析2019年暑期工作坊1工作坊信息· 工作坊简介为推动我国经济、统计等社会科学量化研究方...
        
    640?wx_fmt=png相约钱塘江畔,研讨经济计量

    640?wx_fmt=jpeg

    Stata & Python 实证前沿与爬虫分析2019年暑期工作坊


    1

    工作坊信息

    ·  工作坊简介

    为推动我国经济、统计等社会科学量化研究方法学习与应用,培养和训练社会科学相关领域的青年学者、硕博士研究生,促进社会科学相关领域研究方法科学化规范化,《Stata & Python实证前沿与爬虫分析暑期工作坊》提供一个高水平的学术交流、研究方法普及与研究经验分享的学术平台。工作坊采用模块式教学方法,不仅侧重经济、统计等社会科学量化基本方法的介绍,而且更加注重研究设计与研究选题训练,注重理论与实践相结合,培养学员的社会科学量化分析研究的综合能力。

    经济学研究正经历大转型:最前沿研究越来越少依赖于个别脑力超群学者发展的数学模型,而更多取决于从不断增长的数据中挖掘真知灼见的能力。克拉克奖60%的获得者后来都获得诺贝尔经济学奖,他们主要研究领域变化很大程度上反映经济学科发展趋势。1995年以前,80%获得者主要研究领域为理论,20%为实证。1996-2005年,主要研究领域为理论获奖者比例降至50%,主要研究领域为实证的获奖者比例增至50%。2006-2016年,只有33%获奖者主要研究领域为理论,其余67%均为实证。克拉克奖获得者主要研究领域已由理论转为实证,经济研究前沿主要以数据来验证理论,较少出现新理论创新。

    计算机的迅速发展,更加促进了以数据分析见长的计量经济学的发展。比如Stata软件功能日益强大,并不断开发新程序,以将最常用、最流行、最新计量方法推广应用,大幅提高数据分析效果大数据时代到来,网络数据正成为潜在宝藏,大量商业信息、社会信息以文本等非结构化、异构型数据格式存储于网页中。非计算机专业背景的人也可借助机器学习、人工智能等方法进行研究。使用网络数据进行研究,面临两大难点-数据获取与文本分析。数据获取需要借助Python编程语言设计网络爬虫,而获得的数据中有相当比例数据是非结构化数据,这就需要文本数据分析技术。

    前沿分析固然可能会给你的Paper加分,但不理解其假设,也不知道如何检验假设?在假设得不到满足时也不知道如何用更高级方法去控制?那么会导致前沿方法的滥用!会使你的研究大为失色!为此,邀请三位走在微观计量前沿和爬虫文本分析的学者,为青年教师、研究生们集中讲解前沿模型的基本思想、基于Stata和Python实操估计,并就研究设计、论文选题、国家课题申报等展开辅导和释疑,帮助大家了解数据采集和文本分析

    本课程结合案例,将每部分中学到的知识通过实战方式加深各位对知识的理解,具有极强实用性,内容涵盖了数据分析比较重要和前沿的几个方面。例如江艇老师在前次寒假工作坊关于识别匹配的讲解,让学员有茅塞顿开的感觉;慧航老师与学员分享了最近几个月的最新研究。本次工作坊二位老师又有新的讲解内容与大家分享,给学员带来可能未见或不熟悉的最新微观数据因果识别技术。新加盟工作坊的邓老师乃活跃在国内爬虫文本分析领域的青年学者,为学员带来新的爬虫文本分析技术。根据形势发展需要,工作坊将继续根据各界反馈筹划新的论文撰写与课题申报等期次。


    ·  工作坊特色

    方法应用为基:讲解经济、统计、管理等科学量化前沿方法的机理与Stata & Python实操

    经典论文复制:讲解高质量经典论文如何使用前沿量化方法

    突出研究设计:突出量化方法和经典论文背后的精巧研究设计

    强化互动交流:强化讲师与学员之间的工作论文和研究计划交流


    2

    主讲嘉宾简介

    江艇:香港科技大学商学院经济学博士,中国人民大学经济学院副教授,人大国家发展与战略研究院研究员,人大微观数据与实证方法研究中心副主任,美国哥伦比亚大学商学院访问学者。主要研究领域为经济增长与发展、城市经济学、新政治经济学,在Economics Letters、Review of Development Economics、《经济研究》、《管理世界》、《世界经济》等国内外著名学术刊物上发表多篇论文。曾应邀在多所高校讲授“应用微观计量经济学”短期前沿课程,学员反响热烈。

    司继春(慧航):上海对外经贸大学统计与信息学院助理教授,主要研究领域为微观计量经济学、产业组织理论。在 Journal of Business and Economic Statistics、《财经研究》等学术刊物上发表多篇论文。其实,大家更熟悉的是知乎上大名鼎鼎的[慧航],拥有 219,753 个关注者,获得过 110,578 次赞同,他就是司继春老师 —— [慧航]。

    邓旭东(大邓):哈尔滨工业大学(HIT)管理学院信息管理系统方向在读博士。曾在多所大学分享数据采集和文本分析培训课程,运营【公众号:大邓和他的Python】主要分享Python、爬虫、文本分析、机器学习等相关内容。


    3

    课程安排

    Day 1 上午

    主讲人:江艇

    课程安排:《匹配方法(上)》

    1、如何从反事实框架理解匹配方法?

    2、匹配能解决内生性问题么?

    3、匹配与OLS的区别何在?

    4、为什么说匹配的本质是良好的控制?

    5、匹配是一种估计方法还是一种数据预处理手段?

    重点文献:Dale and Krueger (2002), Imbens (2015)等,Stata实操


    Day 1 下午

    主讲人:江艇

    课程安排:《匹配方法(下)》

    1、如何选择协变量?

    2、如何估计倾向得分?

    3、如何删截样本?

    4、如何构造匹配样本?

    5、应该用协变量匹配还是倾向得分匹配?

    重点文献:Aidt &Franck (2015), Dehejia and Wahba (1999, 2002)等, Stata实操


    Day 2 上午

    主讲人:江艇

    课程安排:《双重差分方法(上)》

    1、双重差分要求随机分组么?

    2、如何根据不同的数据结构设定不同的估计方程? 

    3、双重差分方法的威胁有哪些?

    4、如何展示和解释结果?

    5、如何进行稳健性分析?

    重点文献:Card & Krueger (1994), Nunn & Qian (2011), Qian (2008)等,Stata实操


    Day 2 下午

    主讲人:江艇

    课程安排:《双重差分方法(下)》、《合成控制方法》

    1、双重差分方法与匹配方法的结合

    2、半参数双重差分方法

    3、模糊双重差分方法

    4、单个处理组个体的合成控制方法

    5、多个处理组个体的合成控制方法

    重点文献:Abadie (2005), Abadie et al (2010), Abadie et al (2015), Acemoglu et al (2016), de Chaisemartin and D’HaultfŒuille (2018), Derrien and Kecskes (2013), Fowlie et al (2012)等, Stata实操


    Day 3 上午

    主讲人:司继春(慧航)

    课程安排:《统计基础与机器学习》

    1、条件期望的概念和应用

    2、如何估计条件期望1:OLS

    3、预测:过拟合、欠拟合与交叉验证

    4、如何估计条件期望2:广义线性模型

    5、离散选择模型:Probit、Logit回归与分类树

    学习材料:Wooldridge(2010)、周志华(2016)等,Python等实操


    Day 3 下午

    主讲人:司继春(慧航)

    课程安排:《外生性条件下的推断》

    1、作为因果推断的OLS:控制变量与固定效应

    2、作为因果推断的OLS:系数的解释

    3、作为因果推断的OLS:标准误的估计与统计推断

    4、计量经济学中的离散选择模型:理论基础与解释

    5、面板数据:固定效应、随机效应、交互固定效应

    6、面板数据离散选择模型介绍

    学习材料:Wooldridge(2010)、Train(2009)等,Stata实操


    Day 4 上午

    主讲人:司继春(慧航)

    课程安排:《内生性条件下的推断》

    1、内生性问题:何时出现内生性?

    2、工具变量法:两阶段最小二乘 

    3、工具变量法:控制函数法

    4、使用控制函数法解决非线性模型中的内生性

    5、局部平均处理效应(LATE)

    学习材料:Imbens and Angrit(1004)、Wooldridge(2010)等,Stata实操


    Day 4 下午

    主讲人:司继春(慧航)

    课程安排:《非线性模型与结构模型前沿选讲》

    1、样本选择模型

    2、半结构的政策评价:充分统计量简介

    3、需求估计:几乎完美的需求系统(AIDS)介绍

    4、需求估计:离散选择模型

    5、动态规划与动态离散选择模型(DDC)介绍

    重点文献:Wooldridge(2010)、Train(2009)、Chetty(2009)、Deaton and Muellbauer(1980)、Rust(1987)等,Python & Matlab实操


    Day 5 上午

    主讲人:邓旭东(大邓)

    课程安排:《Python基础语法》

    1、Anaconda安装及使用;Jupyter notebook使用方法;第三方库安装方法

    2、初识python(python语法)

    3、数据结构(编程语言的单词)-list、str、dict、tuple、set

    4、for循环、if逻辑 try-except (编程语言中的句法)

    5、常用函数、常用库


    Day 5 下午

    主讲人:邓旭东(大邓)

    课程安排:《数据采集-Python网络爬虫》

    1、爬虫原理、设计思路;数据抓包(开发者工具使用方法)

    2、网络访问库(requests、selenium);网页数据定位库-bs4、re

    3、静态网站与动态网站区别

    4、数据存储(txt,csv,json)

    5、案例

    例1:(静态)抓取大众点评网酒店数据;

    例2:(动态)淘宝商品商品信息

    例3:selenium抓取百度企业信用


    Day 6 上午

    主讲人:邓旭东(大邓)

    课程安排:《初识文本分析 》

    1、文本分析应用场景;文件的读取(txt、pdf、docx等)

    2、中文分词-jieba库;数据清洗-re、flashtext;pyecharts库制作词云图

    3、数据分析-pandas库

    4、可视化库-matplotlib/seaborn

    5、案例

    例1:词频统计

    例2:excel文件中时间及文本数据处理方法

    例3:共现法构建专业情感词典

    例4:基于词典法进行情感计算

    重点文献:王伟,陈伟,祝效国,王洪伟. 众筹融资成功率与语言风格的说服性-基于Kickstarter的实证研究.管理世界.2016;5:81-98.


    Day 6 下午

    主讲人:邓旭东(大邓)

    课程安排:《文本分析(数据分析)进阶》

    1、监督学习与非监督学习

    2、使用机器学习方法进行文本分析的方法和步骤

    3、表达文本数据信息的方式(one-hot、bag-of-words、TF-IDF)

    4、理解特征矩阵、语料、文档、特征

    5、机器学习库 sklearn语法学习

    6、协同过滤-推荐系统

    7、案例

    例1:lda话题模型实战

    例2:文本分类实战

    重点文献:Wang, Quan, Beibei Li, and Param Vir Singh. "Copycats vs. Original Mobile Apps: A Machine Learning Copycat-Detection Method and Empirical Analysis." Information Systems Research 29.2 (2018): 273-291.


    4

    课程概览

    ·  主办杭州国商智库信息技术服务有限公司

    ·  时间:2019年7月13-18日

    ·  地点:浙江 · 杭州 · 钱塘新区高教园区东区

    ·  主讲嘉宾:江艇;司继春(慧航);邓旭东(大邓)

    ·  授课内容:Stata & Python 实证前沿与爬虫分析


    5

    报名信息

    参加对象全国高等院校及研究机构从事经济科学研究的青年教师。尤其适合那些希望掌握高级实证方法,提升量化研究设计能力和国家课题申报能力的研究者。

    参会费用4800元/人,可开具发票。交通与食宿费自理,提供歌江维嘉大酒店周边住宿信息,并协助安排附近校内就餐事宜。同一单位或机构三人九折,五人八折,同一单位十人七五折(同一税号单位),在校学生可凭学生证补贴折扣200元/人。

    住宿安排:工作坊签约四星级酒店,标间或大床房每天约350元,含自助早餐;或附近旅馆标间、大床房每天约200元。

    报名时间:从即日起(按缴费顺序安排教室座位)。

    报名咨询19817117852;18458247922

    交通路线指南:杭州东站搭乘地铁1号线下沙江滨方向(注意不要选择间隔的临平方向),40分钟即达报到地点:钱塘新区高教园区东区27号大街301号(地铁1号线云水站旁)歌江维嘉大酒店在萧山国际机场打的约半小时到达钱塘新区高教园区东区歌江维嘉大酒店

    缴费信息

    单位:杭州国商智库信息技术服务有限公司

    开户银行: 中国银行杭州大学城支行

    银行账户:6232636200100260588

    特别提示:为不影响各单位、老师、同学的日常工作和学习,工作坊安排在假期举办。如果一些机构暑假期间暂停财务工作,建议拟报名同学老师在之前办理相关事项,报到则可拿到发票,以免等到秋季开学办理而可能有所影响相关程序。


    640?wx_fmt=png

    扫描下方二维码报名(请注明:单位—姓名),提供参会人员个人信息、单位相关信息后缴费。

    640?wx_fmt=png

    下载报名材料:

    链接:https://pan.baidu.com/s/1bjZUPwHYjAjM2XbcLIhH7Q 

    提取码:d4zj 

    640?wx_fmt=png

    640?wx_fmt=jpeg

    请扫码关注我们!



    展开全文
  • 【课程大纲】 Python编程基础: 1 Python爬虫与文本分析概述 1.1 文本数据的重要性 1.1.1 结构化数据 1.1.2 非结构化数据 1.1.3 文本数据 1.2 文本分析 1.2.1 文本分析基本概念 1.2.2 文本分析与自然语言处理的关系...

    【授课老师】

    陈远祥,北京邮电大学副教授。2014年毕业于北京大学,获通信与信息系统专业博士学位,2015年-2017年在北京大学做博士后研究。主要研究方向包括光无线融合技术,智能信号处理,以及基于人工智能的信号处理技术。发表SCI/EI学术论文80余篇,其中第一或通讯作者论文40余篇,申请发明专利4项。主持国家自然科学基金面上项目,国家重点研发计划子课题,国家自然科学基金青年项目及博士后基金等多个国家级和省部级项目。IEEE、OSA会员,OpticsExpress, IEEE Photonics Technology Letters,PhotonicsJournal,Applied Optics等多个SCI期刊审稿人。

    【课程大纲】

    Python编程基础:

    1 Python爬虫与文本分析概述

    1.1 文本数据的重要性

    1.1.1 结构化数据

    1.1.2 非结构化数据

    1.1.3 文本数据

    1.2 文本分析

    1.2.1 文本分析基本概念

    1.2.2 文本分析与自然语言处理的关系

    1.2.3 爬虫与文本分析

    2 Python基础

    2.1 Python语言概述

    2.1.1 起源

    2.1.2 语言特色

    2.1.3 开发环境配置

    2.2 标准数据类型

    2.2.1 bool(布尔)

    2.2.2 number(数字)

    2.2.3 string(字符串)

    2.2.4 list(列表)

    2.2.5 tuple(元组)

    2.2.6 dictionary(字典)

    2.2.7 set(集合)

    2.3 控制流

    2.3.1 顺序

    2.3.2 选择

    2.3.3 循环

    2.3.4 异常处理

    2.4 函数

    2.4.1 定义函数

    2.4.2 调用函数

    2.4.3 匿名函数

    2.5 os文件处理模块

    2.5.1 文件目录操作

    2.5.2 文件读写

    3 Python重要数据科学计算库

    3.1 numpy

    3.1.1 数组的创建

    3.1.2 数组常用内置方法

    3.1.3 数据类型的转换

    3.1.4 数组的索引

    3.1.5 变换数组的形态

    3.1.6 数组的运算

    3.1.7 常用统计函数

    3.2 pandas

    3.2.1 数据帧的创建

    3.2.2 索引与过滤

    3.2.3 增加和删除

    3.2.4 缺失值处理

    3.2.5 数据整理

    3.2.6 统计和描述

    3.2.7 数据的合并和分组运算

    3.2.8 数据的读写和查看

    3.3 matplotlib

    3.3.1 快速绘图

    3.3.2 绘制子图

    3.3.3 添加文字说明和注释

    3.3.4 散点图

    3.3.5 对数坐标图

    3.3.6 极坐标图

    3.3.7 饼图

    3.3.8 柱状图

    3.3.9 直方图

    3.3.10 箱线图

    3.4 pyecharts

    3.4.1 柱状图/条形图

    3.4.2 箱型图

    3.4.3 热力图

    3.4.4 折线图

    3.4.5 散点图

    3.4.6 漏斗图

    3.4.7 饼图

    3.4.8 词云图

    3.4.9 3D图表

    【联系方式】

    尹老师

    电话:010-53352991

    QQ:42884447

    WeChat:yinyinan888

    展开全文
  • Stata &Python实证前沿与爬虫分析2019年暑期工作坊1课程概览· 主办:杭州电子商务研究院·时间:2019年7月13-18日·地点:杭州 ...
        


    640?wx_fmt=jpeg


    Stata & Python实证前沿与爬虫分析2019年暑期工作坊


    1

    课程概览

    ·  主办:杭州电子商务研究院

    ·  时间:2019年7月13-18日

    ·  地点:杭州 · 浙江工商大学

    ·  主讲嘉宾:江艇;司继春(慧航);邓旭东(大邓)

    ·  授课内容:Stata&Python 实证前沿与爬虫分析


    2

    工作坊信息

    ·  工作坊简介

    为推动我国经济、统计等社会科学量化研究方法学习与应用,培养和训练社会科学相关领域的青年学者、硕博士研究生,促进社会科学相关领域研究方法科学化规范化,《Stata & Python实证前沿与爬虫分析暑期工作坊》提供一个高水平的学术交流、研究方法普及与研究经验分享的学术平台。工作坊采用模块式教学方法,不仅侧重经济、统计等社会科学量化基本方法的介绍,而且更加注重研究设计与研究选题训练,注重理论与实践相结合,培养学员的社会科学量化分析研究的综合能力。

    经济学研究正经历大转型:最前沿研究越来越少依赖于个别脑力超群学者发展的数学模型,而更多取决于从不断增长的数据中挖掘真知灼见的能力。克拉克奖60%的获得者后来都获得诺贝尔经济学奖,他们主要研究领域变化很大程度上反映经济学科发展趋势。1995年以前,80%获得者主要研究领域为理论,20%为实证。1996-2005年,主要研究领域为理论的获奖者比例降至50%,而主要研究领域为实证的获奖者比例增至50%。2006-2016年,只有33%获奖者主要研究领域为理论,其余67%均为实证。克拉克奖获得者主要研究领域已由理论转为实证,经济研究前沿主要以数据来验证理论,较少出现新的理论创新。

    计算机的迅速发展,更加促进了以数据分析见长的计量经济学的发展。比如Stata软件功能日益强大,并不断开发新程序,以将用、最流行、最新计量方法推广应用,大幅提高数据分析效果大数据时代到来,网络数据正成为潜在宝藏,大量商业信息、社会信息以文本等非结构化、异构型数据格式存储于网页中。非计算机专业背景的人也可借助机器学习、人工智能等方法进行研究。使用网络数据进行研究,面临两大难点-数据获取与文本分析。数据获取需要借助Python编程语言设计网络爬虫,而获得的数据中有相当比例数据是非结构化数据,这就需要文本数据分析技术。

    前沿分析固然可能会给你的Paper加分,但不理解其假设,也不知道如何检验假设?在假设得不到满足时也不知道如何用更高级方法去控制?那么会导致前沿方法的滥用!会使你的研究大为失色!为此,我们邀请三位走在微观计量前沿和爬虫文本分析的学者,为青年教师、研究生们集中讲解前沿模型的基本思想、基于Stata和Python实操估计,并就研究设计、论文选题、国家课题申报等展开辅导和释疑,帮助大家了解数据采集和文本分析

    本课程结合案例,将每部分中学到的知识通过实战方式加深各位对知识的理解,具有极强实用性,内容涵盖了数据分析比较重要和前沿的几个方面。例如江艇老师在前次寒假工作坊关于识别匹配的讲解,让学员有茅塞顿开的感觉;慧航老师与学员分享了最近几个月的最新研究。本次工作坊二位老师又有新的讲解内容与大家分享,给学员带来可能未见或不熟悉的最新微观数据因果识别技术。新加盟工作坊的邓老师乃活跃在国内爬虫文本分析领域的青年学者,为学员带来新的爬虫文本分析技术。根据形势发展需要,工作坊将继续根据各界反馈筹划新的论文撰写与课题申报等期次。


    ·  工作坊特色

    方法应用为基:讲解经济、统计、管理等科学量化前沿方法的机理与Stata & Python实操

    经典论文复制:讲解高质量经典论文如何使用前沿量化方法

    突出研究设计:突出量化方法和经典论文背后的精巧研究设计

    强化互动交流:强化讲师与学员之间的工作论文和研究计划交流


    3

    主讲嘉宾简介

    江艇:香港科技大学商学院经济学博士,中国人民大学经济学院副教授,人大国家发展与战略研究院研究员,人大微观数据与实证方法研究中心副主任,美国哥伦比亚大学商学院访问学者。主要研究领域为经济增长与发展、城市经济学、新政治经济学,在Economics Letters、Review of Development Economics、《经济研究》、《管理世界》、《世界经济》等国内外著名学术刊物上发表多篇论文。曾应邀在多所高校讲授“应用微观计量经济学”短期前沿课程,学员反响热烈。

    司继春(慧航):上海对外经贸大学统计与信息学院助理教授,主要研究领域为微观计量经济学、产业组织理论。在 Journal of Business and Economic Statistics、《财经研究》等学术刊物上发表多篇论文。其实,大家更熟悉的是知乎上大名鼎鼎的[慧航],拥有 219,753 个关注者,获得过 110,578 次赞同,他就是司继春老师 —— [慧航]。

    邓旭东(大邓):哈尔滨工业大学(HIT)管理学院信息管理系统方向在读博士。曾在多所大学分享数据采集和文本分析培训课程,运营【公众号:大邓和他的Python】主要分享Python、爬虫、文本分析、机器学习等相关内容。


    4

    课程安排

    Day 1 上午

    主讲人:江艇

    课程安排:《匹配方法(上)》

    1、如何从反事实框架理解匹配方法?

    2、匹配能解决内生性问题么?

    3、匹配与OLS的区别何在?

    4、为什么说匹配的本质是良好的控制?

    5、匹配是一种估计方法还是一种数据预处理手段?

    重点文献:Dale and Krueger (2002), Imbens (2015)等,Stata实操


    Day 1 下午

    主讲人:江艇

    课程安排:《匹配方法(下)》

    1、如何选择协变量?

    2、如何估计倾向得分?

    3、如何删截样本?

    4、如何构造匹配样本?

    5、应该用协变量匹配还是倾向得分匹配?

    重点文献:Aidt &Franck (2015), Dehejia and Wahba (1999, 2002)等, Stata实操


    Day 2 上午

    主讲人:江艇

    课程安排:《双重差分方法(上)》

    1、双重差分要求随机分组么?

    2、如何根据不同的数据结构设定不同的估计方程? 

    3、双重差分方法的威胁有哪些?

    4、如何展示和解释结果?

    5、如何进行稳健性分析?

    重点文献:Card & Krueger (1994), Nunn & Qian (2011), Qian (2008)等,Stata实操


    Day 2 下午

    主讲人:江艇

    课程安排:《双重差分方法(下)》、《合成控制方法》

    1、双重差分方法与匹配方法的结合

    2、半参数双重差分方法

    3、模糊双重差分方法

    4、单个处理组个体的合成控制方法

    5、多个处理组个体的合成控制方法

    重点文献:Abadie (2005), Abadie et al (2010), Abadie et al (2015), Acemoglu et al (2016), de Chaisemartin and D’HaultfŒuille (2018), Derrien and Kecskes (2013), Fowlie et al (2012)等, Stata实操


    Day 3 上午

    主讲人:慧航

    课程安排:《统计基础与机器学习》

    1、条件期望的概念和应用

    2、如何估计条件期望1:OLS

    3、预测:过拟合、欠拟合与交叉验证

    4、如何估计条件期望2:广义线性模型

    5、离散选择模型:Probit、Logit回归与分类树

    学习材料:Wooldridge(2010)、周志华(2016)等,Python等实操


    Day 3 下午

    主讲人:慧航

    课程安排:《外生性条件下的推断》

    1、作为因果推断的OLS:控制变量与固定效应

    2、作为因果推断的OLS:系数的解释

    3、作为因果推断的OLS:标准误的估计与统计推断

    4、计量经济学中的离散选择模型:理论基础与解释

    5、面板数据:固定效应、随机效应、交互固定效应

    6、面板数据离散选择模型介绍

    学习材料:Wooldridge(2010)、Train(2009)等,Stata实操


    Day 4 上午

    主讲人:慧航

    课程安排:《内生性条件下的推断》

    1、内生性问题:何时出现内生性?

    2、工具变量法:两阶段最小二乘 

    3、工具变量法:控制函数法

    4、使用控制函数法解决非线性模型中的内生性

    5、局部平均处理效应(LATE)

    学习材料:Imbens and Angrit(1004)、Wooldridge(2010)等,Stata实操


    Day 4 下午

    主讲人:慧航

    课程安排:《非线性模型与结构模型前沿选讲》

    1、样本选择模型

    2、半结构的政策评价:充分统计量简介

    3、需求估计:几乎完美的需求系统(AIDS)介绍

    4、需求估计:离散选择模型

    5、动态规划与动态离散选择模型(DDC)介绍

    重点文献:Wooldridge(2010)、Train(2009)、Chetty(2009)、Deaton and Muellbauer(1980)、Rust(1987)等,Python & Matlab等实操


    Day 5 上午

    主讲人:邓旭东(大邓)

    课程安排:《Python基础语法》

    1、Anaconda安装及使用;Jupyter notebook使用方法;第三方库安装方法

    2、初识python(python语法)

    3、数据结构(编程语言的单词)-list、str、dict、tuple、set

    4、for循环、if逻辑 try-except (编程语言中的句法)

    5、常用函数、常用库


    Day 5 下午

    主讲人:邓旭东(大邓)

    课程安排:《数据采集-Python网络爬虫》

    1、爬虫原理、设计思路;数据抓包(开发者工具使用方法)

    2、网络访问库(requests、selenium);网页数据定位库-bs4、re

    3、静态网站与动态网站区别

    4、数据存储(txt,csv,json)

    5、案例

    例1:(静态)抓取大众点评网酒店数据;

    例2:(动态)淘宝商品商品信息

    例3:selenium抓取百度企业信用


    Day 6 上午

    主讲人:邓旭东(大邓)

    课程安排:《初识文本分析 》

    1、文本分析应用场景;文件的读取(txt、pdf、docx等)

    2、中文分词-jieba库;数据清洗-re、flashtext;pyecharts库制作词云图

    3、数据分析-pandas库

    4、可视化库-matplotlib/seaborn

    5、案例

    例1:词频统计

    例2:excel文件中时间及文本数据处理方法

    例3:共现法构建专业情感词典

    例4:基于词典法进行情感计算

    重点文献:王伟,陈伟,祝效国,王洪伟. 众筹融资成功率与语言风格的说服性-基于Kickstarter的实证研究.管理世界.2016;5:81-98.


    Day 6 下午

    主讲人:邓旭东(大邓)

    课程安排:《文本分析(数据分析)进阶》

    1、监督学习与非监督学习

    2、使用机器学习方法进行文本分析的方法和步骤

    3、表达文本数据信息的方式(one-hot、bag-of-words、TF-IDF)

    4、理解特征矩阵、语料、文档、特征

    5、机器学习库 sklearn语法学习

    6、协同过滤-推荐系统

    7、案例

    例1:lda话题模型实战

    例2:文本分类实战

    重点文献:Wang, Quan, Beibei Li, and Param Vir Singh. "Copycats vs. Original Mobile Apps: A Machine Learning Copycat-Detection Method and Empirical Analysis." Information Systems Research 29.2 (2018): 273-291.


    5

    报名信息

    参加对象全国高等院校及研究机构从事经济科学研究的青年教师。尤其适合那些希望掌握高级实证方法,提升量化研究设计能力和国家课题申报能力的研究者。

    参会费用4800元/人,可开具发票。交通与食宿费自理,提供浙江工商大学周边住宿信息,并协助安排校内就餐事宜。同一单位的三人九折,五人八折,十人七五折,在校学生可以凭学生证补贴折扣200元/人。

    住宿安排:工作坊签约四星级酒店,标间或大床房每天约350元,含自助早餐;或附近旅馆标间、大床房每天约200元。

    报名时间:从即日起。

    报名咨询:

    谢老师:0571-28008825,18458247922  

    丁老师:0571-28008825,19817117852

    交通路线指南杭州东站搭乘地铁1号线下沙江滨方向(注意不要选择间隔的临平方向),40分钟即达文海南路站,文海南路D出口出,步行约200米到达浙江工商大学校园。 在萧山国际机场打的约半小时到达浙江工商大学校下沙校区:杭州市下沙高教园区学正街18号。

    缴费信息:

    单位:杭州国商智库信息技术有限公司

    开户银行: 中国银行

    银行账户:6232636200100260588

    640?wx_fmt=png

    扫描下方二维码报名(入群请注明:单位—姓名),提供参会人员个人信息、单位相关信息后缴费。

    640?wx_fmt=jpeg

    下载报名材料:

    链接:https://pan.baidu.com/s/1bjZUPwHYjAjM2XbcLIhH7Q 

    提取码:d4zj 


    640?wx_fmt=png

    640?wx_fmt=jpeg

    扫码关注我们!





    展开全文
  • 报名时间2019-12-12 14:16 至 2020-02-13 14:16培训...16:30-17:00答疑学习目标:1, 通过线上学习掌握Python编程的基础内容2, 课程涉及到了Python基础大部分内容,内容丰富3, 从Python入门开始介绍,没有软件基础...

    报名时间

    2019-12-12 14:16 至 2020-02-13 14:16

    培训时间

    2020年5月8-10日(三天远程)

    培训地点

    远程学习

    培训费用

    3500

    授课安排

    上午9:00-12:00;下午13:30-16:30;16:30-17:00答疑

    学习目标:

    1, 通过线上学习掌握Python编程的基础内容

    2, 课程涉及到了Python基础大部分内容,内容丰富

    3, 从Python入门开始介绍,没有软件基础也可以

    4, 通过案例的讲解,真正实现授课与实战的目标

    学习对象和基础:

    1、需要学习Python大数据及人工智能的青年教师

    2、需要学习Python大数据及人工智能的博士生

    3、需要学习Python大数据及人工智能的硕士生

    4、需要学习Python大数据及人工智能的高年级本科生

    5、不要求学过Python操作

    【课程特色】

    1,远程答疑不影响任何效果;

    2,录制视频,方便后期回看复习;

    3,学术学习资料大礼包一份;

    4,Peixun.net会员一个月,在线视频全含;

    5,课后赠送VIP2账号15个月,用于后期学习;

    6,年度赠书一本;

    7,后续相同课程现场班可以五折优惠参加。

    课程大纲

    前期准备

    l预习视频:Python基础语法(pandas、numpy、条件语句、循环语句)

    l系统配置:助教远程安装Anaconda(包括Python、Jupyter、extensions)

    Part1可视化(约1.5天)

    (1)厉兵秣马——Python简介与Jupyter配置

    样例

    内容简介:学习基本的环境设置,为后期的代码编辑做准备。

    (2)雾里看花——可视化基本逻辑与主要误区

    内容简介:

    l数据可视化是什么?

    l数据可视化如何在不同的商业场景中进行应用?

    l当下热门的“一图看天下”是什么?

    l数据可视化的误区有哪些?

    (3)无中生有——变量的理解与随机数据生成

    样例

    内容简介:

    l产生模拟的数据

    l对数据进行拼接

    l对数据进行分割

    l数据的筛选与补充

    (4)循序渐进——散点图与条形图的进化过程

    样例

    内容简介:

    l散点图和条形图的适用数据类型

    l散点图的主要参数

    l条形图的主要参数

    l散点图与条形图的实现

    l可视化过程中的数据降维问题

    (5)渐入佳境——用饼图与环形图呈现数据比例

    样例

    内容简介:

    l饼图与环形图的适用场景

    l饼图与环形图的关联与区别

    l饼图与环形图的重要参数

    l饼图与环形图的代码实现

    (6)秘境寻踪——南丁格尔的往事与玫瑰花图

    样例

    内容简介:

    l南丁格尔与玫瑰花图的起源

    l玫瑰花图的基本原理

    l玫瑰花图的衍生

    l相关图像的代码实现

    (7)有条不紊——折线图的设计与多线条呈现

    样例

    内容简介:

    l折线图的应用范围

    l折线图的主要参数

    l折线图的代码实现

    l多折线的呈现技巧

    (8)火眼金睛——分布与箱线图的异常值发现

    样例

    内容简介:

    l什么是数据分布

    l数据分布与异常值

    l分布与箱线图的主要参数

    l分布与箱线图的代码实现

    (9)抽丝剥茧——关联与配对图的相关性识别

    样例

    内容简介:

    l关联图与配对图的关系与区别

    l什么是相关性

    l关联图与配对图的主要参数

    l关联图与配对图的代码实现

    l图像内涵的信息解释

    (10)冰火相融——日历热力图中的周期性探索

    样例

    内容简介:

    l热图的使用场景

    l热图的数据要求

    l热图的核心参数

    l热图的代码实现

    l如何解读热图

    Part2基础建模(约1.5天)

    (1)线性回归——车位价格的预测

    内容简介:

    l线性回归模型简介

    l线性回归模型检验

    l基于python的线性回归模型实现

    样例

    (2)决策树——平台风险识别

    内容简介:

    l决策树的基本概念:信息熵、信息增益、GINI

    l决策树的剪枝

    l基于python的决策树模型实现

    样例

    (3)聚类分析——城市的特征分析

    内容简介:

    l常用聚类模型简介:层次聚类、K均值聚类、密度聚类

    l基于python的层次聚类模型实现

    样例

    优惠:

    现场班老学员9折优惠;

    同一单位三人以上同时报名9折优惠;

    同一单位六人以上同时报名8折优惠;

    以上优惠不叠加。

    联系方式:

    魏老师

    Tel:010-68478566

    Mail:vip@pinggu.org

    展开全文
  • 【金融】【python】CAPM实证分析

    千次阅读 2020-06-23 13:38:56
    CAPM模型实证分析CAPM模型 代码用于 financial asset pricing 课程,三因子模型可见其他博文。 CAPM模型 主要参考了这篇博客https://blog.csdn.net/weixin_42152885/article/details/80239226 #载入股指数据 ...
  • I wrote a confusion matrix calculation code in Python:def conf_mat(prob_arr, input_arr):# confusion matrixconf_arr = [[0, 0], [0, 0]]for i in range(len(prob_arr)):if int(input_arr[i]) == 1:if float(pr...
  • --- #ks曲线 链接:https://www.jianshu.com/p/b1b1344bd99f 风控数据分析学习笔记(二)Python建立信用评分卡 - 简书 fig, ax = plt.subplots() ax.plot(1 - threshold, tpr, label='tpr')# ks曲线要按照预测概率...
  • 直接能运行,有详细说明。 只供科研或者学习作业,不负责作为投资参考。
  • 好久没更新 python 专题了,这里介绍一个编写的小应用吧(能力有限,做得有点粗糙),写论文做实证分析用得到。原 Github 项目地址请点击阅读原文Introduction在写论文的时候,我们经常要对各序列做描述性分析,例如下...
  • python 金融分析 应该使用什么模型所说所有的变量都是对象。 对象在python里,其实是一个指针,指向一个数据结构,数据结构里...求一篇金融专业关于实证分析的论文,有模型,数据...你好的! ⑴ 首先就不要有马上毕...
  • 描述性统计分析在实证研究中的作用及具体软件实现——以SPSS为例为了提升经管代码库(https://bbs.pinggu.org/forum-2626-1.html)人气,一大早起床,打算就微观实证分析中描述性统计分析作用及SPSS具体软件实现做个...
  • 【摘要】本文首先分析了中国股市的现状,提出了利用行为金融学范式研究投资者情绪与股市收益关系的必要性及合理性。然后利用主成分分析法,从剔除宏观经济面影响后的多维投资者情绪代理变量中,运用...经过实证分析,得...
  • Python数据挖掘与文本分析&Stata应用能力提升与实证前沿云特训Python部分明天(6月29日-7月2日)开始上课,感兴趣的童鞋抓紧哦用Python处理数据大家都不陌生了,属常规...
  • 通过爬虫获取的海量信息,我们可以对其进行进一步的分析:市场预测、文本分析、机器学习方法等。 文本挖掘的意义:文献量激增.人们日常生活中所接触到的信息有80%左右是以文本的方式存在的,更具有潜在的商业和科学...
  • 使用Python实证研究扩大到更大的数据 威斯康星大学麦迪逊分校的讲习班材料。 该研讨会的目的是为那些在分析适合内存的数据方面具有丰富经验但对扩展到大于内存数据集感兴趣的研究人员提供帮助。 将涉及以下主题...
  • 一、线性回归(Linear Regression)介绍线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。其表达形式为y = w'x +e,e为误差服从均值为0的正态...
  • python进行因子分析

    千次阅读 2020-03-24 21:23:16
    人工智能股票实证分析 一:研究背景和意义: 近几年人工智能的兴起,导致大量人工智能企业的诞生或崛起,故本文从4个维度选取15个主要财务指标对159家人工智能股票进行聚类分析和因子分析,主要将公司分成三大类和...
  • 它是机器学习社区用于机器学习算法的实证分析的数据库,领域理论和数据生成器的集合。该档案由David Aha和加州大学欧文分校的研究生于1987年创建为ftp档案。从那时起,它已被全世界的学生、教育工作者和研究人员广泛...
  • Discounted Cash Flow Application当知道了时间价值的...本期笔者来给大家简单介绍DiscountedCashApplication以及股利贴现模型(DDM)python实证。01NPV&IRRNPV(net present value净现值)指未来资金(现金)流入(...
  • 孙丽泊摘要:随着中国金融体系的逐步完善和大数据时代的到来,新技术在金融领域的应用不断深化。本文在马科维茨投资组合理论的基础上,借助Python工具...通过实证分析,进一步说明马科维茨投资组合理论在金融风险管...
  • 其运用范围非常广泛,不少学生在写作统计学论文时,都困在了选题这一步,其实就统计学而言,可供作为论文题目的热词有很多,如:企业管理、实证研究、统计估计、统计分析、计算机应用、支持向量机、数学模型、GIS、...
  • 最近有小伙伴在问我一个数据分析的问题, 做毕设, 实证分析. 不知道改如何处理数据.看了下设计的量表大致是这样的, 都是 5级的里克特量表, 大致分为两波, X, Y. 小伙伴认为就只有两个变量, 这是从商业理论上来认识的,...

空空如也

空空如也

1 2 3 4 5
收藏数 98
精华内容 39
关键字:

python实证分析

python 订阅