NLP(PyTorch)
NLP
自然语言处理(NLP
):就是轻松教会计算机理解人类的语言,像阅读、回答问题、识别语音这些日常操作,都离不开他。这其中,有几大关键算法功不可没:
- 词袋模型:像数豆子一样统计每个词出现的次数,虽然不考虑顺序,却能帮计算机快速分类文本情绪。
- 循环神经网络(
RNN
):专门对付一连串信息,比如做翻译和预测下一句,只是对长句子力不从心。 - 长短时记忆网络(
LSTM
):升级版的RNN
,解决了记忆差的问题,擅长学习语言中的长距离关联。 - 支持向量机(
SVM
):经典分类器,在区分不同类别文本上有一手。 - 生成对抗网络(
GAN
):一边生成文本一边鉴别真伪。用于生成逼真的对话内容 - 注意力机制:让模型懂得抓重点,像机器翻译和摘要提炼,就用上了这一招。
- 预训练语言模型:
BRET、GPT
等明星模型先在海量文本里“修炼”,然后应用于各种场景。 Transformer
:自注意力机制的核心,编码解码一手抓,翻译和生成任务轻松搞定。