DMER站长博客分析师资源站

DMER数据分析

 找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

查看: 1598|回复: 0

[知识] 在Python中Keras LSTM神经网络序列分类

[复制链接]

1040

主题

1337

帖子

3万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
38244
QQ
发表于 2017-8-24 05:41:42 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
在Python中Keras LSTM神经网络序列分类
Jason Brownlee对长短期记忆网络2016年7月26日
序列分类是一个预测建模问题,你在空间或时间上有一些输入序列,任务是预测序列的类别。
使这个问题变得困难的是,序列长度不同,由大量的输入符号组成,可能需要模型学习输入序列中符号之间的长期上下文或依赖关系。
在这篇文章中,你会发现你可以开发LSTM神经网络模型使用keras深度学习lib库Python序列分类问题。
读完这篇文章后你会知道:
如何制定一个序列分类问题的对应模型。
如何减少过度拟合你的LSTM模型通过使用差。
如何对应模型的卷积神经网络,擅长学习空间关系结合。
让我们开始吧。
更新2016:十月keras 1.1.0更新andtensorflow 0.10.0实例。
更新损坏/ 2017:keras 2.0.2更新为例,tensorflow 1.0.1和Theano 0.9.0。
Sequence-Classification-with-LSTM-Recurrent-Neural-Networks-in-Python-with-Keras.jpg
问题描述
我们将使用演示本教程序列学习是IMDB电影评论情感分类问题。每部电影的评论是一个字变量序列和每部电影的评论的情感必须分类。
大电影评论集(通常称为IMDB的数据集)包含25000个高极性的电影评论(好或坏)的培训和再测试相同。问题是要确定是否一个给定的电影评论有积极的或消极的情绪。
这些数据是由斯坦福的研究人员收集和使用了2011条分裂50-50的数据用于训练和测试。达到88.89%的精度。
keras提供访问IMDB数据内置。IMDB。load_data()功能允许你在一个准备使用神经网络和深度学习模型格式的数据负载。
话已由整数表示数据集中的每一个字的命令的频率更换。在每次审查句子因此由一个整数序列。
字嵌入
我们将把每一个电影评论映射成一个真正的矢量域,这是一种流行的文本嵌入技术。这是一种在高维空间中把单词编码为实值向量的技术,其中词义之间的相似性转化为向量空间的接近性。
Keras提供了一个便捷的方式将文字正整数表示成一个字的嵌入,嵌入层。
我们将每个单词在32长实值向量。我们还将把我们对建模感兴趣的单词的总数限制在5000个最频繁的单词上,并将其余的单词清零。最后,序列长度(字数)在每次审查不同,所以我们将限制每个评论是500个字,截断长的评论和垫短评论零价值。
现在我们已经定义了我们的问题,以及如何将数据准备和模型化,我们准备建立一个对应模型分类电影情回顾。

http://dmer.cn  数据分析论坛,已经更新全部文章和帖子
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|关于我们|小黑屋|手机版|Archiver|帮助|DMER 数据分析 ( 蜀ICP备13007024号-2  

GMT+8, 2018-6-23 08:38 , Processed in 0.285200 second(s), 38 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表