我的坎坷秋(春)招求职之路

发表于 2023-05-21 | 分类于随笔 | 热度 ℃ |

字数统计 2,091 字 | 阅读时长 7 分钟

现在是23年5月份，工作已基本有了着落，回首过去的几个月，竟发现这条求职路是如此的坎坷。

阅读全文 »

强化学习-A3C

发表于 2020-07-16 | 分类于 python | 热度 ℃ |

字数统计 1,297 字 | 阅读时长 6 分钟

这应该是最后一篇关于强化学习的内容了，使用A3C算法玩平衡杆游戏。

阅读全文 »

强化学习-DQN

发表于 2020-07-16 | 分类于 python | 热度 ℃ |

字数统计 1,303 字 | 阅读时长 6 分钟

之前两篇文章介绍的内容其实都属于策略网络，即用神经网络去模拟在给定状态s下，每个动作a的执行概率。这篇用到的DQN则属于值函数网络，在这一大类里又可以分为：状态值函数和状态-动作值函数，DQN属于后者，即用神经网络去模拟在给定状态s和动作a的情况下，回报的期望。

阅读全文 »

强化学习-PPO2

发表于 2020-07-16 | 分类于 python | 热度 ℃ |

字数统计 1,650 字 | 阅读时长 8 分钟

仍旧是玩平衡杆游戏，不过这次用了更为强大的PPO2，看完之后不经感叹里面的思想真的是太奇妙了！相较于朴素的策略网络，多了好多新的trick，不敢想象发明这个算法的人是有多聪明。

阅读全文 »

强化学习-策略网络

发表于 2020-07-15 | 分类于 python | 热度 ℃ |

字数统计 824 字 | 阅读时长 4 分钟

我一直觉得强化学习是走向强人工智能的一个必经过程，现有的许多问答系统中也时常会出现强化学习的身影。本文使用策略网络玩强化学习入门的平衡杆游戏。

阅读全文 »

爬取天气信息

发表于 2020-07-15 | 分类于 python | 热度 ℃ |

字数统计 219 字 | 阅读时长 1 分钟

使用requests和BeautifulSoup爬取天气信息。

阅读全文 »

文本相似度计算

发表于 2020-07-14 | 分类于 python | 热度 ℃ |

字数统计 2,747 字 | 阅读时长 13 分钟

本文介绍文本相似度计算的各种方法，可以广泛应用在基于问答对匹配的问答系统中。

阅读全文 »

BERT文本分类

发表于 2020-07-13 | 分类于 python | 热度 ℃ |

字数统计 1,461 字 | 阅读时长 8 分钟

使用Huggingface中预训练的BERT模型进行文本分类。

阅读全文 »

问句类型分类器

发表于 2020-06-19 | 分类于 python | 热度 ℃ |

字数统计 1,197 字 | 阅读时长 5 分钟

到目前为止，复旦的不倒翁问答系统只能回答事实类问题，不具备闲聊功能，为了真正做到“不倒问答”，我使用 fasttext 做了一个问句类型分类器，用来判断是事实类问题还是闲聊问题，效果好的出奇。

阅读全文 »

问答系统调研

发表于 2020-06-09 | 分类于论文 | 热度 ℃ |

字数统计 2,336 字 | 阅读时长 9 分钟

在完成毕业论文（设计）期间的调研工作，主要研究了几个经典的问答系统和机器阅读理解模型。

阅读全文 »