内容正文:
同学们,老师从一个专业统计的官网上找到了B站2024年4月最具影响力的UP主榜单,有你熟悉的up主吗?
这些up主都有很强的影响力,如果我们也想成为一个有影响力的UP主,除了主题内容的选择制作需要花费我们的时间之外,我们每天需要在B站上投入多长时间呢?
1
人工智能中的算法:预测
走进B站UP主,解锁时间密码
今天让我们一起走进B站UP主,解锁他们背后的时间密码
从而为我们打造有影响力的账号提供时间上的参考
2
目录
1
活动一:探究预测UP主B站使用时间的因素
2
活动二:提高预测UP主B站使用时间的精度
3
活动三:预测算法的拓展与应用
3
发贴数
被评论
被点赞
消息回复数
你觉得哪个因素最能预测该up主在B站上的投入时间?
学生会预测多种因素,处理方式:收集的数据集是
【数据集】
B站使用时间(分钟)
发帖量(每天)
收到的点赞/喜欢数
(每天)
收到的评论数
(每天)
发送信息数
(每天)
总计1000条
……
为了寻找几个不同因素之间的规律,我们搜集了1千条B站up主数据,来寻找up主的发帖量、被点赞数、被评论数、发送消息数之间的关系
5
活动一:探究预测UP主B站使用时间的因素
被点赞/喜欢数
B站每天
使用时间
1.描述散点图,自变量、因变量、二者变化趋势
2.一个点赞数是150的up主,他的B站使用时间是多少?
自变量:点赞/喜欢数
因变量:有效学习时间
趋势:二者正相关
一次函数:Y=kx+b
根据以往数据进行推测
但是我们很难透过excel数据表看出各个因素之间的关系,于是老师做了一张散点图,请同学们来说一说,在这张散点图中,自变量、因变量、二者的变化趋势各是什么?
透过散点图我们可以很清楚地看到,被点赞数与UP主的B站使用时间呈正相关
那么,如果一位点赞数是150的UP主,他的B站使用时间是多少?
你是根据以往的数据来预测该UP主的使用时间,
如果我们想要更加精确地预测这个UP主的B站使用时间,老师根据散点图的趋势拟合了一条直线出来,这条直线熟悉吗?对,是同学们熟悉的一次函数
那么,老师又拟合了两条,请问,这三条中,哪一条预测更为精准?
6
被点赞/喜欢数
B站每天
使用时间
真实值
预测值
均方误差
MSE
但是在这条最为精准的线上,仍然有点不在上面,比如这里的点,我们预测的值比实际值要小,
于是我们把所有这些预测值与真实值之间的差进行平方再除以预测的次数成为均方差MSE,这个值的大小可以帮助我们衡量拟合出来的这条线的准确性
7
自变量:喜欢数
因变量:
B站使用时间
模型拟合度
刚刚是老师随手画的一条,接下来我们用人工智能算法帮助我们找到最佳拟合的一次函数
【演示程序的使用方法】
我们来分析这个运行结果
首先,我们得到了一个一次函数
其次,我们还得到了MSE和R方
R方的作用可以告诉我们,B站的使用时间85%由喜欢数决定,那么你们觉得,R方越大越好还是越小越好?
8
活动一:探究预测UP主B站使用时间的因素
1. 小组中一位同学打开活动一文件夹中的huigui.py运行,其他同学学习观察
该名同学操作程序,替换小组假设的因素
2.组长先在任务单上记录你们小组探究的结果,然后把小组结果填写在黑板上
四人一组,进行探究:
接下来的时间,交给同学们进行实操,四人一组,针对小组最开始的假设进行探究
我们发现哪个因素最能预测UP主的B站使用时间?
原因是什么呢?
9
同学们刚刚做的工作我们称之为回归分析
这里提到了两种类型的回归分析,分别是一元线性回归分析和多元线性回归分析,同学们来说一说,我们刚刚做的是哪个?
到黑板上张贴出来
10
多个因素对UP主的B站使用时间有着不同程度的影响
探讨多个自变量和因变量的关系
多重线性回归:
Y=k1X1+k2X2+k3X3+……+b
我们从活动一中除了可以得到喜欢数最能预测up主的B站使用视频,还有一个发现,不同因素在不同程度上都与因变量呈线性关系
那我们能不能尝试把不同因素都纳入预测中,形成这样的线性回归方程,这个方程中有多少个自变量?
这种回归方程我们把它称之为,多元线性回归方程
11
活动二:提高预测UP主B站使用时间的精度
1. 小组合作打开活动二文件夹中的duoyuanhuigui.py运行
参考“活动二操作指导”,替换特征组合,记录结果
2.组长记录结果,小组内讨论哪个自变量组合预测效果最佳
小组合作,讨论探究最佳预测的自变量组合(每组至少4个自变量组合)
3.全班范围分享
学生任务单写起来较慢
12
活动二:提高预测UP主B站使用时间的精度
利用同学们探索出来的最佳模型对up主的b站使用时间进行验证
UP主B站使用时间
发帖量
收到的点赞/喜欢数
收到的评论数
发送信息数
随机选择一个UP主的4个变量并进行预测
Y=23.25+1.25*P+0.82*L+0.17*C+1.48*M
教师演示,存在误差,分析原因
与前面学生的猜想进行对应
13
线性回归算法
决策树算法
KNN算法
活动三:预测算法的拓展与应用
逻辑回归算法
预测使用时间
预测up主情绪
预测应该选择哪个领域
打造有影响力的UP主账号
预测你的UP主类型
推荐类似UP主视频
参考:https://www.cnblogs.com/faithtwo/p/15426020.html
今天学的是线性回归预测算法,但是预测算法还有很多种
比如逻辑回归方法,我们可以使用逻辑回归算法基于B站UP主的使用时间、点赞数、被评论数等预测UP主的情绪是高兴、还是悲伤
比如决策树算法,我们可以使用决策树算法帮助我们判断,如果我们要准备打造一个非常有影响力的B站账号,它可以帮助我们预测我们可以选择哪个领域,是教育博主还是游戏博主
比如KNN算法,可以根据你的点赞数等数据分析你属于哪一类的博主,再给你推荐类似博主的视频
根据以往的天气预测未来的天气
根据以往的驾驶习惯进行驾驶风格分类,进而预测驾驶人员的车速
你们觉得预测算法还可以用在生活的哪里?
活动三:预测算法的拓展与应用
农业、航空、金融、成绩、医疗、交通
其实,如果我们要做预测事物,还有很多方法可以选择
15
活动三:预测算法的应用
预测
被点赞数
你作为学习型UP主在本节课中的影响力等级
请同学们双击【学生素材】中的pingjia.py,
其实,同学们这节课的表现就像是我们B站的学习型博主
老师作为观众,给你们点了很多赞,看你们上台分享发帖,给你们回复,但是呢,老师这里没有具体给你们区分,因此我们使用之前你们的一元线性回归模型来进行预测
让我们一起来看看,你们在本节课的投入时间,属于哪个级别
最后留5分钟,不同等级的学生分享
16
$$