科学网

 找回密码
  注册
如何用Python批量提取PDF文本内容?
热度 5 王树义 2018-3-22 13:03
本文为你展示,如何用Python把许多PDF文件的文本内容批量提取出来,并且整理存储到数据框中,以便于后续的数据分析。 问题 最近,读者们在后台的留言,愈发五花八门了。 写了几篇关于自然语言处理的文章后,一种呼声渐强: 老师,pdf中的文本内容,有没有什么方便的方法提取出来呢? 我能体会到读者的心 ...
27159 次阅读|7 个评论 热度 5
如何用Python和机器学习训练中文文本情感分类模型?
热度 3 王树义 2018-3-13 07:20
利用Python机器学习框架scikit-learn,我们自己做一个分类模型,对中文评论信息做情感分析。其中还会介绍中文停用词的处理方法。 疑惑 前些日子,我在微信后台收到了一则读者的留言。 我一下子有些懵——这怎么还带点播了呢? 但是旋即我醒悟过来,好像是我自己之前挖了个坑。 之前我写过《 如何用Python从海量 ...
22977 次阅读|7 个评论 热度 3
如何用Python爬数据?(一)网页抓取
热度 1 王树义 2018-3-4 08:06
你期待已久的Python网络数据爬虫教程来了。本文为你演示如何从网页里找到感兴趣的链接和说明文字,抓取并存储到Excel。 需求 我在公众号后台,经常可以收到读者的留言。 很多留言,是读者的疑问。只要有时间,我都会抽空尝试解答。 但是有的留言,乍看起来就不明所以了。 例如下面这个: 一分钟后,他可能觉得不 ...
28673 次阅读|2 个评论 热度 1
如何用人工智能帮你找论文?
热度 5 王树义 2018-2-19 20:10
传统的关键词检索论文,浩如烟海的结果让你无所适从?试试人工智能检索引擎。根据你的研究兴趣和偏好,便捷而靠谱帮你找论文。 烦恼 进入一个新领域,读论文是必然途径。 读者一般会遇到2个问题: 如何获取论文全文; 如何筛选该读哪些论文。 在信息匮乏时代,第一个问题就会难倒许多人。 好在近年来, ...
17962 次阅读|5 个评论 热度 5
如何用Python做词云?(基础篇视频教程)
王树义 2018-2-11 09:46
只需要花10几分钟,跟着教程完整做一遍,你就能自己用Python做出词云了。 《 如何用Python做词云? 》图文版发布于2017年6月,是我数据科学系列教程中的第一篇。 目前仅简书一个平台,阅读数量就已经超过2万。 我一直不断收到读者的留言和来信,询问自己动手尝试过程中遇到的问题。 大部分的疑问,来自于Wi ...
9570 次阅读|没有评论
如何免费云端运行Python深度学习框架?
热度 4 王树义 2018-2-1 15:10
想运行TuriCreate,却没有苹果电脑,也没有Linux使用经验,怎么办?用上这款云端应用,让你免安装Python运行环境。一分钱不用花,以高性能GPU,轻松玩儿转深度学习。 痛点 《 如何用Python和深度神经网络识别图像? 》一文发布后,收到了很多读者的留言。大家对从前印象中高不可攀的深度神经网络图片识别来了兴趣, ...
18377 次阅读|4 个评论 热度 4
如何用VOSviewer分析CNKI关键词共现?
热度 3 王树义 2018-1-5 10:05
用VOSviewer尝试CNKI中文文献关键词共现(keyword co-occurence)分析时,你可能会踩到一个大坑。本文帮助你绕开这个坑,或是从坑里爬出来。 疑惑 在《 如何用VOSviewer分析CNKI数据? 》一文中,我们提到了如何用VOSviewer可视化分析CNKI文献。 依照文中的步骤,我们从CNKI下载并导出《图书情报知识》期刊2016年全 ...
36248 次阅读|3 个评论 热度 3
如何用Python和深度神经网络识别图像?
热度 11 王树义 2017-12-28 20:30
只需要10几行Python代码,你就能自己构建机器视觉模型,对图片做出准确辨识和分类。快来试试吧! 视觉 进化的作用,让人类对图像的处理非常高效。 这里,我给你展示一张照片。 如果我这样问你: 你能否分辨出图片中哪个是猫,哪个是狗? 你可能立即会觉得自己遭受到了莫大的侮辱。并且大声质问我:你觉得我智 ...
17629 次阅读|18 个评论 热度 11
如何用Python读取开放数据?
热度 1 王树义 2017-12-15 19:48
当你开始接触丰富多彩的开放数据集时,CSV、JSON和XML等格式名词就会奔涌而来。如何用Python高效地读取它们,为后续的整理和分析做准备呢?本文为你一步步展示过程,你自己也可以动手实践。 需求 人工智能的算法再精妙,离开数据也是“巧妇难为无米之炊”。 数据是宝贵的,开放数据尤其珍贵。无论是公众号、微博 ...
14025 次阅读|1 个评论 热度 1

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-9-21 10:13

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部