Fork me on GitHub
Welcome to Luson's home

就怕你宁愿流泪望天却不昂首向前


  • 首页

  • 分类

  • 归档

  • 标签

我的坎坷秋(春)招求职之路

发表于 2023-05-21 | 分类于 随笔 | 热度 ℃  |  
字数统计 2,091 字 | 阅读时长 7 分钟

现在是23年5月份,工作已基本有了着落,回首过去的几个月,竟发现这条求职路是如此的坎坷。

阅读全文 »

强化学习-A3C

发表于 2020-07-16 | 分类于 python | 热度 ℃  |  
字数统计 1,297 字 | 阅读时长 6 分钟

这应该是最后一篇关于强化学习的内容了,使用A3C算法玩平衡杆游戏。

阅读全文 »

强化学习-DQN

发表于 2020-07-16 | 分类于 python | 热度 ℃  |  
字数统计 1,303 字 | 阅读时长 6 分钟

之前两篇文章介绍的内容其实都属于策略网络,即用神经网络去模拟在给定状态s下,每个动作a的执行概率。这篇用到的DQN则属于值函数网络,在这一大类里又可以分为:状态值函数和状态-动作值函数,DQN属于后者,即用神经网络去模拟在给定状态s和动作a的情况下,回报的期望。

阅读全文 »

强化学习-PPO2

发表于 2020-07-16 | 分类于 python | 热度 ℃  |  
字数统计 1,650 字 | 阅读时长 8 分钟

仍旧是玩平衡杆游戏,不过这次用了更为强大的PPO2,看完之后不经感叹里面的思想真的是太奇妙了!相较于朴素的策略网络,多了好多新的trick,不敢想象发明这个算法的人是有多聪明。

阅读全文 »

强化学习-策略网络

发表于 2020-07-15 | 分类于 python | 热度 ℃  |  
字数统计 824 字 | 阅读时长 4 分钟

我一直觉得强化学习是走向强人工智能的一个必经过程,现有的许多问答系统中也时常会出现强化学习的身影。本文使用策略网络玩强化学习入门的平衡杆游戏。

阅读全文 »

爬取天气信息

发表于 2020-07-15 | 分类于 python | 热度 ℃  |  
字数统计 219 字 | 阅读时长 1 分钟

使用requests和BeautifulSoup爬取天气信息。

阅读全文 »

文本相似度计算

发表于 2020-07-14 | 分类于 python | 热度 ℃  |  
字数统计 2,747 字 | 阅读时长 13 分钟

本文介绍文本相似度计算的各种方法,可以广泛应用在基于问答对匹配的问答系统中。

阅读全文 »

BERT文本分类

发表于 2020-07-13 | 分类于 python | 热度 ℃  |  
字数统计 1,461 字 | 阅读时长 8 分钟

使用Huggingface中预训练的BERT模型进行文本分类。

阅读全文 »

问句类型分类器

发表于 2020-06-19 | 分类于 python | 热度 ℃  |  
字数统计 1,197 字 | 阅读时长 5 分钟

到目前为止,复旦的不倒翁问答系统只能回答事实类问题,不具备闲聊功能,为了真正做到“不倒问答”,我使用 fasttext 做了一个问句类型分类器,用来判断是事实类问题还是闲聊问题,效果好的出奇。

阅读全文 »

问答系统调研

发表于 2020-06-09 | 分类于 论文 | 热度 ℃  |  
字数统计 2,336 字 | 阅读时长 9 分钟

在完成毕业论文(设计)期间的调研工作,主要研究了几个经典的问答系统和机器阅读理解模型。

阅读全文 »
12…5
陆轩韬

陆轩韬

一只等待进化为程序猿的猴子

47 日志
10 分类
22 标签
RSS
GitHub
友情链接
  • 个人主页 @ 陆轩韬
  • jxtxzzw空间 @ 张臻炜
© 2023 陆轩韬
主题 - NexT.Pisces
博客全站共58.1k字