投资者情绪对股票市场回报率的影响探讨
本文是一篇投资分析论文,通过挖掘分析微博平台中投资者情绪的变化发现,在疫情这个大环境背景下,网络社交媒体中的网络舆情会对股市产生影响,因此从网络舆情的角度对投资者、网络社交平台提出相关建议。
1相关理论与方法基础
1.1行为金融学理论
传统金融学理论认为,金融市场上的投资者均为理性人,金融市场是一个有效的市场。由于投资者是理性的,金融市场资产价格并不会随着投资者情绪产生波动。但随着时间推移,金融市场上出现许多有效市场假说无法解释的异象。传统金融学理论认为的观点与如今的实际数据出现偏差。基于这些偏差,学者们开始质疑传统金融学理论的适用性,行为金融学理论逐渐产生。
行为金融学理论将人类心理活动如何对金融市场产生影响纳入研究范围[41]。随着行为金融学理论的迅速发展,对传统金融学理论造成了很大的冲击。行为金融学博采众长,涉及心理学,社会学等领域、人类学及其他有关概念,从行为产生的内在心理活动进化开始,探讨了投资者投资决策在金融市场中的作用。行为金融学理论具有许多代表性学说,例如认知偏差理论。认知偏差理论指出,当一个人面对投资决策时,根据自己的经验法则来评判,这一行为易导致决策失误。行为金融学包括许多经典理论,这些理论为后续投资者情绪对金融市场影响的相关研究奠定了扎实的理论基础。
..................
1.2文本挖掘技术
在网络信息时代,用户可通过网络获取各种不同形式,不同门类的数据,包括技术资料,娱乐资讯。组成一个异常巨大的数据库。对大量数据进行采集和加工,传统信息检索技术的加工方法已不能令人满意,而文本挖掘技术可以有效解决这一问题[42]。文本挖掘作为数据挖掘中的重要分支之一,它是从数据挖掘演变而来。它可以将网络中获取的文本内容转化为可被利用的信息,但它不仅仅是将数据挖掘技术简单地挪用到文本上,还需要做很多准备与处理工作。
1.2.1文本挖掘过程介绍
文本挖掘是一个从非结构化到结构化的过程,是多方技术的综合。总体来看,文本挖掘是将非结构化的原始文本信息进行一系列处理,变成结构化数据从而进行知识发现。根据文本挖掘工作的流程,将其过程分为以下几个部分:
(1)文本获取:网络文本一般以网页的形式出现,需要利用爬虫技术对网页进行抓取并形成文本数据库。
(2)文本预处理;对文本信息进行筛选,去除网页中的不必要信息。
(3)分词:词是最小的情感单元,分词即将连续的句子按照规则切分成词语,对于中文分词,国内已有许多开源的分词工具。
(4)去停用词:将一些如标点符号等没有研究意义的停用词去除,有利于更高效地处理数据。
(5)特征选择:从原始特征中筛选出有效特征从而对数据集进行降维的过程。
(6)文本挖掘:完成上述步骤后,文本数据转化为矩阵,根据需要选择算法对文本进行挖掘。
....................
2投资者情绪指数的构建
2.1文本信息获取来源及采集方法
2.1.1文本信息获取来源
互联网如今作为重要的信息获取来源,迎来了大量的使用者。根据CNNIC发布的第49次《中国互联网络发展状况统计报告》显示,截至2021年12月,互联网使用者的数目已经达到10.32亿,互联网普及率达到73.0%[43]。随着网民规模的稳步增长,更多的人会主动地在社交媒体平台发表自己的意见看法,表达自己对各类事件的情绪,互联网成为情绪信息获取的重要平台。本文也选择互联网中社交媒体作为构造投资者情绪所需的文本数据来源,对比各种社交媒体,本文最终选择微博作为信息获取来源。微博在社会分发速度、影响力、传播速度等方面都优于其他社交媒体。也是现在年轻人进行资源共享及信息交流的首选工具。由于本文研究发生于新冠疫情背景下,对于新冠疫情这种影响广泛的突发公共卫生事件,人们更愿意在微博这种面向大众的平台上表达自己的观点与看法,因此微博更能及时地反映情绪的变化。综上,本文选择微博作为文本信息的获取来源。
2.1.2文本信息的爬取方法
由于微博数据复杂且存在各种限制,无法通过普适性方法对所需全部信息进行抓取,因此,本文采用爬虫技术,根据本文所需数据自行编写程序,来实现文本自动化抓取。爬虫是指模拟浏览器通过一些程序对网络信息自动抓取的过程。爬虫的基本流程如图2-1:
投资分析论文参考
...............................
2.2文本数据的预处理
经过爬虫技术获取微博原始文本后,需要经过清洗、分词、去除停用词等预处理工作,才能转化成可以被识别的格式,进而开展后续的分类和情感分析工作。文本数据预处理包括数据清洗。分词及去除停用词。
2.2.1文本数据清洗
爬取的微博数据常常都带有一些无关字符和网页链接的标签等,还有一些语句中夹杂的符号,如“【】”“#”等,这些对文本的情绪分析无关,可能会影响情绪分析的准确性。因此,在进行文本分析前,要对这些无关信息进行数据清洗。
2.2.2文本分词
由于中文语句一般没有空格符间隔,因此需要将语句进行切分割,将每条语句的词语分开,转化为一个个有语义特征的词语,进而转化为一定长度的数值型特征向量进行后续的情绪分析及相关计算。分词是分类过程的一个基本环节,文中选用的分词方法是在Python环境中使用jieba分词程序包实现中文文本数据分词。把它加工为具有语义特征的一定长度的词。
jieba是一款被广泛使用的高性能及高准确率的中文开源分词包。且提供如Python、C++等多种编程语言支持,使用非常方便。它是基于规则和统计两种方法建立的。jieba分词支持四种分词模式,即精确模式、全模式、搜索引擎模式和Paddle模式,本文主要调用了分词模式中的精确模式,这个模式能最准确地分离句子,适合文本分析。同时,jieba分词支持用户添加自定义词典,以便包含jieba里没有的词汇。在分词过程中发现,jieba分词库的词汇不完全包含疫情相关固定词汇,会容易导致这些词汇被错误地拆分,通过对分词后的结果进行归纳整理,形成了疫情自定义词典,将其加入到jieba自定义分词库中重新进行分词。例如,没有添加自定义词典前,jieba原始分词库将“无症状感染者”分成“无症状”和“感染者”两个词语,所以为了保证分词的严谨性,将这些疫情固定词汇加入再进行分词,以达到更为精准的效果。
......................
3投资者情绪对股票市场回报率影响的实证分析......................23
3.1样本选取................................23
3.2变量说明....................................23
4投资者情绪对股票回报率影响的行业差异分析....................33
4.1样本选取......................................33
4.1.1医药行业样本选取................................33
4.1.2旅游行业样本选取............................33
5研究结论与政策建议...............................47
5.1研究结论........................................47
5.2相关政策建议............................48
4投资者情绪对股票回报率影响的行业差异分析
4.1样本选取
4.1.1医药行业样本选取
在新冠疫情的强烈冲击下,国内大部分行业都停滞不前。相对于其他行业而言,医药行业自身的韧性很强,遇到疫情冲击时自我调节能力较强。从股价的角度来看,疫情期间医药卫生行业发展迅猛,医药行业股票价格呈上涨趋势,市场对于医药行业股票回报率的确定性,使医药股备受投资者的青睐。
本文选择上证医药主题指数(000121)作为衡量医药行业的代表指数。上证医药主题指数是从上证综指中以规模大小为标准,选择归属于医药卫生行业的50只主题股票组成的指数,是上交证券所上市的大、中市值且日成交金额为前50支的股票组合。这一指数具有较高的相关性和准确性,能较好地反映医药股的整体市场波动,因此该指数被选为反映医药股整体表现的代表性指数。
4.1.2旅游行业样本选取
以人员的空间移动为主的旅游业,对于疫情这类重大突发公共事件具有高敏感性。由于旅游活动本身具有时空特点,因此旅游业的恢复要比其他行业慢很多,损失和影响也是即刻显现的。与此同时,因为疫情爆发是在春节来临之际,许多居民的出游计划被迫取消,大多旅游企业经营举步维艰,投资者对于疫情的悲观情绪使得收益率下降。本文选择中证旅游指数(930633)作为旅游行业的代表指数。
投资分析论文怎么写
.......................
5研究结论与政策建议
5.1研究结论
在新冠疫情背景下,股票市场发生严重震荡,通过研究新冠疫情引起的投资者恐慌情绪对股票市场的影响,有助于投资者做出合理投资决策。本文选取2020年1月9日到2021年12月31日作为研究区间,选择微博作为反映投资者对疫情产生情绪变化的文本信息来源,利用网络爬虫技术完成了新冠疫情相关微博内容的收集工作,并对收集到的文本进行分词等预处理工作后,利用随机森林算法对全部文本进行分类,分别构建了疫情爆发期和疫情常态期的投资者情绪指数,并构建VAR模型与对应时间段的A股市场回报率进行实证研究,分析疫情不同时期投资者情绪与A股市场回报率二者的关系,同时选取受疫情影响较大的3个行业,分别是医药、旅游、交通运输。利用VAR模型,研究疫情不同时期投资者情绪对不同行业的影响差异。本文主要得出以下结论:
一、投资者情绪与A股市场回报率存在单向格兰杰因果关系,且该种关系仅在疫情爆发期存在。在疫情爆发期,投资者情绪是股票市场回报率的格兰杰原因、因为在疫情初爆发的时期,投资者面对突发疫情无法快速做出决策,较为依赖社交平台上其他投资者态度影响,当发布内容多为对疫情及市场利害信息后,投资者投资的意愿减少,导致回报率降低;但在疫情常态期,投资者情绪不是市场回报率格兰杰原因,因为在此时期,投资者面对常态化疫情已经可以自主分析市场变化趋势,对社交平台发表言论及态度的参考性减少。
二、投资者情绪变化会引起A股市场回报率的变化,但在疫情不同时期的股票回报率对投资者情绪的反应程度有所不同。从脉冲响应和方差分解结果来看,在疫情爆发期,投资者情绪的变动会导致A股市场回报率产生同向变动,投资者情绪增加会导致A股市场回报率增加,影响可持续7-8期,解释力度可达到24.45%左右,疫情爆发期投资者情绪对股票市场回报率影响不容忽视。在疫情常态期,投资者情绪的变化对A股市场回报率的影响作用十分微弱,解释力度仅为0.65%,随着疫情发展进入中长期,市场恐慌情绪逐渐稳定,疫情进入常态化,带给股市的边际效益减弱,说明疫情对A股市场产生的边际震荡效应逐渐减弱。
参考文献(略)
- 农业综合开发项目投资分析——以当涂县江心洲国际...2023-10-30
- 企业数字化能提高对外直接投资速度吗?2024-01-02
- 公司创业投资对被投资企业技术创新绩效的作用机制...2024-02-08
- 累积前景理论下投资组合问题的分析和求解2024-03-11