3.89 score from hupso.pl for:
spaces.ac.cn



HTML Content


Title科学空间|scientific spaces

Length: 22, Words: 2
Description 渴望成为一个小飞侠

Length: 9, Words: 0
Keywords 科学,空间,科学空间,科学fm,天文,数学,量子,费曼,路径积分,对称,积分,变分,生活,情感,科普,python,深度学习,模型,nlp
Robots
Charset UTF-8
Og Meta - Title pusty
Og Meta - Description pusty
Og Meta - Site name pusty
Tytuł powinien zawierać pomiędzy 10 a 70 znaków (ze spacjami), a mniej niż 12 słów w długości.
Meta opis powinien zawierać pomiędzy 50 a 160 znaków (łącznie ze spacjami), a mniej niż 24 słów w długości.
Kodowanie znaków powinny być określone , UTF-8 jest chyba najlepszy zestaw znaków, aby przejść z powodu UTF-8 jest bardziej międzynarodowy kodowaniem.
Otwarte obiekty wykresu powinny być obecne w stronie internetowej (więcej informacji na temat protokołu OpenGraph: http://ogp.me/)

SEO Content

Words/Characters 288
Text/HTML 38.88 %
Headings H1 2
H2 22
H3 9
H4 0
H5 0
H6 0
H1
科学空间|scientific spaces
no flash player!
H2
search
menu
categories
newposts
comments
userlogin
互怼的艺术:从零直达wgan-gp
前言
通用爬虫探索(三):效果展示与代码
部分效果
通用爬虫探索(二):落实到论坛爬取上
深度优先
通用爬虫探索(一):适用一般网站的爬虫
简介
【不可思议的word2vec】5. tensorflow版的word2vec
不同的地方
如何“扒”站?手把手教你爬百度百科~
假设
记录一次半监督的情感分析
思路
【不可思议的word2vec】 4.不一样的“相似”
相似度的定义
H3
参与科学空间
关于站长
搜索内容
热门标签
最新文章
最近评论
友情链接

背景乐
H4
H5
H6
strong
千奇百怪
天文探索
数学研究
物理化学
信息时代
生物自然
图片摄影
问题百科
生活/情感
资源共享
千奇百怪
天文探索
数学研究
物理化学
信息时代
生物自然
图片摄影
问题百科
生活/情感
资源共享
深度优先搜索算法
这是笔者参加今年的泰迪杯c题的论文简化版。虽然最后只评上了一个安慰奖,但个人感觉里边有些思路对爬虫工作还是有些参加价值的。所以还是放出来供大家参考一下。
遍历算法
编程技巧
b
千奇百怪
天文探索
数学研究
物理化学
信息时代
生物自然
图片摄影
问题百科
生活/情感
资源共享
千奇百怪
天文探索
数学研究
物理化学
信息时代
生物自然
图片摄影
问题百科
生活/情感
资源共享
深度优先搜索算法
这是笔者参加今年的泰迪杯c题的论文简化版。虽然最后只评上了一个安慰奖,但个人感觉里边有些思路对爬虫工作还是有些参加价值的。所以还是放出来供大家参考一下。
遍历算法
编程技巧
i
em
Bolds strong 24
b 24
i 0
em 0
Zawartość strony internetowej powinno zawierać więcej niż 250 słów, z stopa tekst / kod jest wyższy niż 20%.
Pozycji używać znaczników (h1, h2, h3, ...), aby określić temat sekcji lub ustępów na stronie, ale zwykle, użyj mniej niż 6 dla każdego tagu pozycje zachować swoją stronę zwięzły.
Styl używać silnych i kursywy znaczniki podkreślić swoje słowa kluczowe swojej stronie, ale nie nadużywać (mniej niż 16 silnych tagi i 16 znaczników kursywy)

Statystyki strony

twitter:title pusty
twitter:description pusty
google+ itemprop=name pusty
Pliki zewnętrzne 9
Pliki CSS 4
Pliki javascript 5
Plik należy zmniejszyć całkowite odwołanie plików (CSS + JavaScript) do 7-8 maksymalnie.

Linki wewnętrzne i zewnętrzne

Linki 231
Linki wewnętrzne 1
Linki zewnętrzne 230
Linki bez atrybutu Title 221
Linki z atrybutem NOFOLLOW 0
Linki - Użyj atrybutu tytuł dla każdego łącza. Nofollow link jest link, który nie pozwala wyszukiwarkom boty zrealizują są odnośniki no follow. Należy zwracać uwagę na ich użytkowania

Linki wewnętrzne

- #

Linki zewnętrzne

valid xhtml http://validator.w3.org/check/referer
打赏 http://spaces.ac.cn/reward.html
latex http://spaces.ac.cn/latex.html
天象 http://spaces.ac.cn/ac.html
链接 http://spaces.ac.cn/links.html
博览 http://spaces.ac.cn/science.html
相册 http://spaces.ac.cn/album.html
目录 http://spaces.ac.cn/content.html
千奇百怪 http://spaces.ac.cn/category/everything/
天文探索 http://spaces.ac.cn/category/astronomy/
数学研究 http://spaces.ac.cn/category/mathematics/
物理化学 http://spaces.ac.cn/category/phy-chem/
信息时代 http://spaces.ac.cn/category/big-data/
生物自然 http://spaces.ac.cn/category/biology/
图片摄影 http://spaces.ac.cn/category/photograph/
问题百科 http://spaces.ac.cn/category/questions/
生活/情感 http://spaces.ac.cn/category/life-feeling/
资源共享 http://spaces.ac.cn/category/resources/
互怼的艺术:从零直达wgan-gp http://spaces.ac.cn/archives/4439/
通用爬虫探索(三):效果展示与代码 http://spaces.ac.cn/archives/4430/
通用爬虫探索(二):落实到论坛爬取上 http://spaces.ac.cn/archives/4422/
通用爬虫探索(一):适用一般网站的爬虫 http://spaces.ac.cn/archives/4413/
【不可思议的word2vec】5.... http://spaces.ac.cn/archives/4402/
如何“扒”站?手把手教你爬百度百科~ http://spaces.ac.cn/archives/4385/
记录一次半监督的情感分析 http://spaces.ac.cn/archives/4374/
【不可思议的word2vec】 4... http://spaces.ac.cn/archives/4368/
【语料】2500万中文三元组! http://spaces.ac.cn/archives/4359/
科学空间添加新域名kexue.fm http://spaces.ac.cn/archives/4356/
ofey84: 其实从物理学的角度,没必要纠结是否可除。j^2=1的代数体系不... http://spaces.ac.cn/archives/3060/comment-page-1#comment-8171
velkan: 感谢博主分享~ 我测试了一下,按照博主的方法最终分词效果目测可... http://spaces.ac.cn/archives/3956/comment-page-1#comment-8170
懵懂: 感谢博主分享!50万的那个词典介意分享一下吗?不方便的话请问这... http://spaces.ac.cn/archives/4304/comment-page-1#comment-8169
潇然: 关于做qa这方面,苏神有没有什么相关的大致思路,最近做这个一直... http://spaces.ac.cn/archives/4338/comment-page-1#comment-8168
halosir: 编程 http://spaces.ac.cn/archives/3902/comment-page-1#comment-8167
苏剑林: ^_^ http://spaces.ac.cn/archives/3922/comment-page-1#comment-8166
苏剑林: 你说博客?还是编程? http://spaces.ac.cn/archives/3902/comment-page-1#comment-8165
小明: 搞懂了,是全概率公式-_-. http://spaces.ac.cn/archives/3922/comment-page-1#comment-8164
robin: 你好强啊! http://spaces.ac.cn/archives/3735/comment-page-1#comment-8163
robin: 有理想和追求的人,赞一个! http://spaces.ac.cn/archives/1773/comment-page-1#comment-8162
登录 http://spaces.ac.cn/admin/login.php
科学空间|scientific spaces http://kexue.fm/
登录 http://spaces.ac.cn/admin/login.php
valid xhtml http://validator.w3.org/check/referer
打赏 http://spaces.ac.cn/reward.html
latex http://spaces.ac.cn/latex.html
天象 http://spaces.ac.cn/ac.html
链接 http://spaces.ac.cn/links.html
博览 http://spaces.ac.cn/science.html
相册 http://spaces.ac.cn/album.html
目录 http://spaces.ac.cn/content.html
-
欢迎订阅
http://kexue.fm/feed
-
google
https://www.google.com.hk
-
天象信息
http://kexue.fm/ac.html
-
观测iss
http://kexue.fm/archives/41/
-
数学公式
http://kexue.fm/archives/1866/
-
关于本站
http://kexue.fm/archives/12/
千奇百怪everything http://spaces.ac.cn/category/everything/
天文探索astronomy http://spaces.ac.cn/category/astronomy/
数学研究mathematics http://spaces.ac.cn/category/mathematics/
物理化学phy-chem http://spaces.ac.cn/category/phy-chem/
信息时代big-data http://spaces.ac.cn/category/big-data/
生物自然biology http://spaces.ac.cn/category/biology/
图片摄影photograph http://spaces.ac.cn/category/photograph/
问题百科questions http://spaces.ac.cn/category/questions/
生活/情感life-feeling http://spaces.ac.cn/category/life-feeling/
资源共享resources http://spaces.ac.cn/category/resources/
千奇百怪 http://spaces.ac.cn/category/everything/
天文探索 http://spaces.ac.cn/category/astronomy/
数学研究 http://spaces.ac.cn/category/mathematics/
物理化学 http://spaces.ac.cn/category/phy-chem/
信息时代 http://spaces.ac.cn/category/big-data/
生物自然 http://spaces.ac.cn/category/biology/
图片摄影 http://spaces.ac.cn/category/photograph/
问题百科 http://spaces.ac.cn/category/questions/
生活/情感 http://spaces.ac.cn/category/life-feeling/
资源共享 http://spaces.ac.cn/category/resources/
会员注册 http://spaces.ac.cn/admin/register.php
会员登录 http://spaces.ac.cn/admin/login.php
>>全空间文章列表>> http://kexue.fm/content.html
互怼的艺术:从零直达wgan-gp http://spaces.ac.cn/archives/4439/
阅读剩余部分... http://spaces.ac.cn/archives/4439/
信息时代 http://spaces.ac.cn/category/big-data/
概率 http://spaces.ac.cn/tag/%e6%a6%82%e7%8e%87/
神经网络 http://spaces.ac.cn/tag/%e7%a5%9e%e7%bb%8f%e7%bd%91%e7%bb%9c/
无监督 http://spaces.ac.cn/tag/%e6%97%a0%e7%9b%91%e7%9d%a3/
gan http://spaces.ac.cn/tag/gan/
阅读全文 http://spaces.ac.cn/archives/4439/
2 评论 http://spaces.ac.cn/archives/4439/#comments
通用爬虫探索(三):效果展示与代码 http://spaces.ac.cn/archives/4430/
- http://kexue.fm/usr/uploads/2017/06/2360648379.png
阅读剩余部分... http://spaces.ac.cn/archives/4430/
信息时代 http://spaces.ac.cn/category/big-data/
网站 http://spaces.ac.cn/tag/%e7%bd%91%e7%ab%99/
爬虫 http://spaces.ac.cn/tag/%e7%88%ac%e8%99%ab/
阅读全文 http://spaces.ac.cn/archives/4430/
2 评论 http://spaces.ac.cn/archives/4430/#comments
通用爬虫探索(二):落实到论坛爬取上 http://spaces.ac.cn/archives/4422/
阅读剩余部分... http://spaces.ac.cn/archives/4422/
信息时代 http://spaces.ac.cn/category/big-data/
网站 http://spaces.ac.cn/tag/%e7%bd%91%e7%ab%99/
爬虫 http://spaces.ac.cn/tag/%e7%88%ac%e8%99%ab/
阅读全文 http://spaces.ac.cn/archives/4422/
抢沙发 http://spaces.ac.cn/archives/4422/#comments
通用爬虫探索(一):适用一般网站的爬虫 http://spaces.ac.cn/archives/4413/
阅读剩余部分... http://spaces.ac.cn/archives/4413/
信息时代 http://spaces.ac.cn/category/big-data/
网站 http://spaces.ac.cn/tag/%e7%bd%91%e7%ab%99/
爬虫 http://spaces.ac.cn/tag/%e7%88%ac%e8%99%ab/
阅读全文 http://spaces.ac.cn/archives/4413/
抢沙发 http://spaces.ac.cn/archives/4413/#comments
【不可思议的word2vec】5. tensorflow版的word2vec http://spaces.ac.cn/archives/4402/
《【不可思议的word2vec】 1.数学原理》 http://kexue.fm/archives/4299/
阅读剩余部分... http://spaces.ac.cn/archives/4402/
信息时代 http://spaces.ac.cn/category/big-data/
深度学习 http://spaces.ac.cn/tag/%e6%b7%b1%e5%ba%a6%e5%ad%a6%e4%b9%a0/
词向量 http://spaces.ac.cn/tag/%e8%af%8d%e5%90%91%e9%87%8f/
word2vec http://spaces.ac.cn/tag/word2vec/
阅读全文 http://spaces.ac.cn/archives/4402/
抢沙发 http://spaces.ac.cn/archives/4402/#comments
如何“扒”站?手把手教你爬百度百科~ http://spaces.ac.cn/archives/4385/
阅读剩余部分... http://spaces.ac.cn/archives/4385/
信息时代 http://spaces.ac.cn/category/big-data/
爬虫 http://spaces.ac.cn/tag/%e7%88%ac%e8%99%ab/
语料 http://spaces.ac.cn/tag/%e8%af%ad%e6%96%99/
阅读全文 http://spaces.ac.cn/archives/4385/
抢沙发 http://spaces.ac.cn/archives/4385/#comments
记录一次半监督的情感分析 http://spaces.ac.cn/archives/4374/
《openai新研究发现无监督情感神经元:可直接调控生成文本的情感》 http://jiqizhixin.com/article/2612?from=singlemessage
阅读剩余部分... http://spaces.ac.cn/archives/4374/
信息时代 http://spaces.ac.cn/category/big-data/
深度学习 http://spaces.ac.cn/tag/%e6%b7%b1%e5%ba%a6%e5%ad%a6%e4%b9%a0/
文本挖掘 http://spaces.ac.cn/tag/%e6%96%87%e6%9c%ac%e6%8c%96%e6%8e%98/
阅读全文 http://spaces.ac.cn/archives/4374/
抢沙发 http://spaces.ac.cn/archives/4374/#comments
【不可思议的word2vec】 4.不一样的“相似” http://spaces.ac.cn/archives/4368/
阅读剩余部分... http://spaces.ac.cn/archives/4368/
信息时代 http://spaces.ac.cn/category/big-data/
词向量 http://spaces.ac.cn/tag/%e8%af%8d%e5%90%91%e9%87%8f/
word2vec http://spaces.ac.cn/tag/word2vec/
互信息 http://spaces.ac.cn/tag/%e4%ba%92%e4%bf%a1%e6%81%af/
阅读全文 http://spaces.ac.cn/archives/4368/
5 评论 http://spaces.ac.cn/archives/4368/#comments
1 http://spaces.ac.cn/page/1/
2 http://spaces.ac.cn/page/2/
3 http://spaces.ac.cn/page/3/
4 http://spaces.ac.cn/page/4/
103 http://spaces.ac.cn/page/103/
» http://spaces.ac.cn/page/2/
科学空间|scientific spaces 介绍 http://kexue.fm/archives/12/
spaces_ac_cn http://kexue.fm/archives/4096/
google http://www.google.com.hk
转载 http://spaces.ac.cn/tag/%e8%bd%ac%e8%bd%bd/
网站 http://spaces.ac.cn/tag/%e7%bd%91%e7%ab%99/
天象 http://spaces.ac.cn/tag/%e5%a4%a9%e8%b1%a1/
积分 http://spaces.ac.cn/tag/%e7%a7%af%e5%88%86/
力学 http://spaces.ac.cn/tag/%e5%8a%9b%e5%ad%a6/
python http://spaces.ac.cn/tag/python/
数论 http://spaces.ac.cn/tag/%e6%95%b0%e8%ae%ba/
节日 http://spaces.ac.cn/tag/%e8%8a%82%e6%97%a5/
几何 http://spaces.ac.cn/tag/%e5%87%a0%e4%bd%95/
方程 http://spaces.ac.cn/tag/%e6%96%b9%e7%a8%8b/
微分方程 http://spaces.ac.cn/tag/%e5%be%ae%e5%88%86%e6%96%b9%e7%a8%8b/
费曼 http://spaces.ac.cn/tag/%e8%b4%b9%e6%9b%bc/
复数 http://spaces.ac.cn/tag/%e5%a4%8d%e6%95%b0/
竞赛 http://spaces.ac.cn/tag/%e7%ab%9e%e8%b5%9b/
生活 http://spaces.ac.cn/tag/%e7%94%9f%e6%b4%bb/
情感 http://spaces.ac.cn/tag/%e6%83%85%e6%84%9f/
翻译 http://spaces.ac.cn/tag/%e7%bf%bb%e8%af%91/
引力 http://spaces.ac.cn/tag/%e5%bc%95%e5%8a%9b/
级数 http://spaces.ac.cn/tag/%e7%ba%a7%e6%95%b0/
素数 http://spaces.ac.cn/tag/%e7%b4%a0%e6%95%b0/
矩阵 http://spaces.ac.cn/tag/%e7%9f%a9%e9%98%b5/
流星 http://spaces.ac.cn/tag/%e6%b5%81%e6%98%9f/
相对论 http://spaces.ac.cn/tag/%e7%9b%b8%e5%af%b9%e8%ae%ba/
诺贝尔奖专题 http://spaces.ac.cn/tag/%e8%af%ba%e8%b4%9d%e5%b0%94%e5%a5%96/
向量 http://spaces.ac.cn/tag/%e5%90%91%e9%87%8f/
互怼的艺术:从零直达wgan-gp http://spaces.ac.cn/archives/4439/
通用爬虫探索(三):效果展示与代码 http://spaces.ac.cn/archives/4430/
通用爬虫探索(二):落实到论坛爬取上 http://spaces.ac.cn/archives/4422/
通用爬虫探索(一):适用一般网站的爬虫 http://spaces.ac.cn/archives/4413/
【不可思议的word2vec】5. tenso... http://spaces.ac.cn/archives/4402/
如何“扒”站?手把手教你爬百度百科~ http://spaces.ac.cn/archives/4385/
记录一次半监督的情感分析 http://spaces.ac.cn/archives/4374/
【不可思议的word2vec】 4.不一样的“相似” http://spaces.ac.cn/archives/4368/
【语料】2500万中文三元组! http://spaces.ac.cn/archives/4359/
科学空间添加新域名kexue.fm http://spaces.ac.cn/archives/4356/
ofey84 http://spaces.ac.cn/archives/3060/comment-page-1#comment-8171
velkan http://spaces.ac.cn/archives/3956/comment-page-1#comment-8170
懵懂 http://spaces.ac.cn/archives/4304/comment-page-1#comment-8169
潇然 http://spaces.ac.cn/archives/4338/comment-page-1#comment-8168
halosir http://spaces.ac.cn/archives/3902/comment-page-1#comment-8167
苏剑林 http://spaces.ac.cn/archives/3922/comment-page-1#comment-8166
苏剑林 http://spaces.ac.cn/archives/3902/comment-page-1#comment-8165
小明 http://spaces.ac.cn/archives/3922/comment-page-1#comment-8164
robin http://spaces.ac.cn/archives/3735/comment-page-1#comment-8163
robin http://spaces.ac.cn/archives/1773/comment-page-1#comment-8162
宇宙驿站 http://cosmostation.lamost.org/website/
科学松鼠会 http://songshuhui.net
数学研发 http://bbs.emath.ac.cn
空间天文网 http://space.lamost.org
seatop http://www.seatop.com.cn/
科学相册 http://album.spaces.ac.cn/
xiaoxia http://xiaoxia.org/
积分表-网络版 http://wiki.spaces.ac.cn/doku.php?id=%e7%a7%91%e5%ad%a6:%e6%95%b0%e5%ad%a6:%e7%a7%af%e5%88%86%e8%a1%a8:%e7%a7%af%e5%88%86%e8%a1%a8
matrix67 http://www.matrix67.com/blog/
丝路博傲 http://blog.dvxj.com/
宇宙的心弦 http://www.physixfan.com/
物理问题 http://physics.stackexchange.com/
卢昌海主页 http://www.changhai.org/
ifreethinking http://www.ifreethinking.com/
朗道集结号 http://weibo.com/wangchaohep
project euler https://projecteuler.net/recent
aops http://www.artofproblemsolving.com/forum/
子谋的blog http://zhangzimou.com/
青空天文社 http://bbs.astrobusters.com/
tahoroom http://taho.cc/
山东大学天文协会 http://sdutianxie.org/
ph4ntasy 饭特稀 http://www.ph4ntasy.com/
数学之家 http://www.2math.cn/
acrafter http://acrafter.space
有趣天文奇观 http://interesting-sky.china-vo.org/
天文地理知识 http://www.dili520.com/
创造狮创意导航 http://chuangzaoshi.com/
申请链接 http://kexue.fm/links.html
click here http://www.macromedia.com/go/getflashplayer
flash mp3 player http://www.flashmp3player.org
- http://creativecommons.org/licenses/by-nc-nd/2.5/cn/
署名-非商业用途-保持一致 http://creativecommons.org/licenses/by-nc-nd/2.5/cn/
laogui http://www.geekg.com
typecho 1.0 http://typecho.org
粤icp备09093259号 http://www.miibeian.gov.cn

Zdjęcia

Zdjęcia 11
Zdjęcia bez atrybutu ALT 8
Zdjęcia bez atrybutu TITLE 10
Korzystanie Obraz ALT i TITLE atrybutu dla każdego obrazu.

Zdjęcia bez atrybutu TITLE

http://kexue.fm/usr/themes/geekg/images/menu6.gif
http://kexue.fm/usr/themes/geekg/images/google.png
http://kexue.fm/usr/themes/geekg/images/saturn.png
http://kexue.fm/usr/themes/geekg/images/iss.png
http://kexue.fm/usr/themes/geekg/images/pi.png
http://kexue.fm/usr/themes/geekg/images/about.png
http://kexue.fm/usr/themes/geekg/images/yuzhou.gif
http://kexue.fm/usr/themes/geekg/images/banquan.png
http://kexue.fm/usr/uploads/2017/06/2360648379.png
http://kexue.fm/usr/themes/geekg/images/cc.gif

Zdjęcia bez atrybutu ALT

http://kexue.fm/usr/themes/geekg/images/menu6.gif
http://kexue.fm/usr/themes/geekg/images/google.png
http://kexue.fm/usr/themes/geekg/images/saturn.png
http://kexue.fm/usr/themes/geekg/images/iss.png
http://kexue.fm/usr/themes/geekg/images/pi.png
http://kexue.fm/usr/themes/geekg/images/about.png
http://kexue.fm/usr/themes/geekg/images/yuzhou.gif
http://kexue.fm/usr/themes/geekg/images/banquan.png

Ranking:


Alexa Traffic
Daily Global Rank Trend
Daily Reach (Percent)









Majestic SEO











Text on page:

search menu valid xhtml 打赏latex天象链接博览相册目录 categories 千奇百怪天文探索数学研究物理化学信息时代生物自然图片摄影问题百科生活/情感资源共享 newposts 互怼的艺术:从零直达wgan-gp 通用爬虫探索(三):效果展示与代码 通用爬虫探索(二):落实到论坛爬取上 通用爬虫探索(一):适用一般网站的爬虫 【不可思议的word2vec】5.... 如何“扒”站?手把手教你爬百度百科~ 记录一次半监督的情感分析 【不可思议的word2vec】 4... 【语料】2500万中文三元组! 科学空间添加新域名kexue.fm comments ofey84: 其实从物理学的角度,没必要纠结是否可除。j^2=1的代数体系不... velkan: 感谢博主分享~ 我测试了一下,按照博主的方法最终分词效果目测可... 懵懂: 感谢博主分享!50万的那个词典介意分享一下吗?不方便的话请问这... 潇然: 关于做qa这方面,苏神有没有什么相关的大致思路,最近做这个一直... halosir: 编程 苏剑林: ^_^ 苏剑林: 你说博客?还是编程? 小明: 搞懂了,是全概率公式-_-. robin: 你好强啊! robin: 有理想和追求的人,赞一个! userlogin 登录 --> --> 科学空间|scientific spaces 登录 valid xhtml 打赏latex天象链接博览相册目录 渴望成为一个小飞侠 欢迎订阅 google 天象信息 观测iss 数学公式 关于本站 欢迎访问“科学空间”,我们将与您共同探讨科学,感悟人生;我们期待你的参与 千奇百怪everything天文探索astronomy数学研究mathematics物理化学phy-chem信息时代big-data生物自然biology图片摄影photograph问题百科questions生活/情感life-feeling资源共享resources 千奇百怪天文探索数学研究物理化学信息时代生物自然图片摄影问题百科生活/情感资源共享 感谢国家天文台lamost项目之“宇宙驿站”提供网络空间和数据库资源! 感谢国家天文台崔辰州博士等人的多方努力和技术支持! 科学空间欢迎您转载本站文章,但在转载本站原创文章时,希望您能够尊重版权,注明来自科学空间,谢谢! 参与科学空间 为了保证你的利益,推荐你注册为本站会员。同时欢迎通过邮件或留言与我探讨科学,反馈科学空间的问题。 会员注册 会员登录 >>全空间文章列表>> 8 jun 互怼的艺术:从零直达wgan-gp 作者:苏剑林 | 发布时间:2017-06-08 前言gan,全称generative adversarial nets,中文名是生成对抗式网络。对于gan来说,最通俗的解释就是“伪造者-鉴别者”的解释,如艺术画的伪造者和鉴别者。一开始伪造者和鉴别者的水平都不高,但是鉴别者还是比较容易鉴别出伪造者伪造出来的艺术画。但随着伪造者对伪造技术的学习后,其伪造的艺术画会让鉴别者识别错误;或者随着鉴别者对鉴别技术的学习后,能够很简单的鉴别出伪造者伪造的艺术画。这是一个双方不断学习技术,以达到最高的伪造和鉴别水平的过程。 然而,稍微深入了解的读者就会发现,跟现实中的造假者不同,造假者会与时俱进地使用新材料新技术来造假,而gan最神奇而又让人困惑的地方是它能够将随机噪声映射为我们所希望的正样本,有噪声就有正样本,这不是无本生意吗,多划算~另一个情况是,自从wgan提出以来,基本上gan的主流研究都已经变成了wgan上去了,但wgan的形式事实上已经跟“伪造者-鉴别者”差得比较远了。而且wgan虽然最后的形式并不复杂,但是推导过程却用到了诸多复杂的数学,使得我无心研读原始论文。这迫使我要找从一条简明直观的线索来理解gan。幸好,经过一段时间的思考,有点收获。阅读剩余部分... 分类:信息时代 标签:概率, 神经网络, 无监督, gan 阅读全文 2 评论 7 jun 通用爬虫探索(三):效果展示与代码 作者:苏剑林 | 发布时间:2017-06-07 部分效果部分网站的爬取效果。其中图1是本博客的爬取效果,表明该方案是适用一般网站的;图2和图3是两个开源的论坛程序搭建起来的论坛的爬取效果,表明对于开源程序能够正常爬取;图4是对著名的天涯论坛的爬取效果,表明哪怕是公司内部开发的论坛,也具有不错的效果。阅读剩余部分... 分类:信息时代 标签:网站, 爬虫 阅读全文 2 评论 6 jun 通用爬虫探索(二):落实到论坛爬取上 作者:苏剑林 | 发布时间:2017-06-06 前述的方案,如果爬取的页面仅仅有单一的有效区域,如博客页、新闻页等,那么基本上来说已经足够了。但是,诸如像论坛这样的具有比较明显的层次划分的网站,我们需要进一步细分。因为经过上述步骤,我们虽然能够把有效文本提取出来,但结果是把所有文本放在一块了。深度优先而为了给内容进一步“分块”,我们还需要利用dom树的位置信息。如上一篇的dom树图,我们需要给每个节点和叶子都编号,即我们需要一个遍历dom树的方式。这里我们采用“深度优先”的方案。深度优先搜索算法(英语:depth-first-search,简称dfs)是一种用于遍历或搜索树或图的算法。沿着树的深度遍历树的节点,尽可能深的搜索树的分支。当节点v的所在边都己被探寻过,搜索将回溯到发现节点v的那条边的起始节点。这一过程一直进行到已发现从源节点可达的所有节点为止。如果还存在未被发现的节点,则选择其中一个作为源节点并重复以上过程,整个进程反复进行直到所有节点都被访问为止。阅读剩余部分... 分类:信息时代 标签:网站, 爬虫 阅读全文 抢沙发 6 jun 通用爬虫探索(一):适用一般网站的爬虫 作者:苏剑林 | 发布时间:2017-06-06 这是笔者参加今年的泰迪杯c题的论文简化版。虽然最后只评上了一个安慰奖,但个人感觉里边有些思路对爬虫工作还是有些参加价值的。所以还是放出来供大家参考一下。简介一个爬虫可以分为两个步骤:1.把网页下载下来;2.从网页中把所需要的信息抽取出来。这两个步骤都存在相应的技术难点。对于第一个步骤,难度在于如何应对各大网站的反爬虫措施,如访问频率过高则封ip或者给出验证码等,这需要根据不同网站的不同反爬虫措施来设计,理论上不存在通用的可能性。对于第二个步骤,传统的做法是设计对应的正则表达式,随着网站设计上日益多样化,正则表达式的写法也相应变得困难。显然,想要得到一个通用的爬虫方案,用传统的正则表达式的方案是相当困难的。但如果我们跳出正则表达式的思维局限,从全局的思维来看网站,结合dom树来解析,那么可以得到一个相当通用的方案。因此,本文的主要内容,是围绕着爬虫的第二个步骤进行展开。本文的工作分为两个部分进行:首先,提出了一个适用于一般网站的信息抽取方案,接着,将这个方案细化,落实到论坛的信息抽取上。阅读剩余部分... 分类:信息时代 标签:网站, 爬虫 阅读全文 抢沙发 27 may 【不可思议的word2vec】5. tensorflow版的word2vec 作者:苏剑林 | 发布时间:2017-05-27 本文封装了一个比较完整的word2vec,其模型部分使用tensorflow实现。本文的目的并非只是再造一次word2vec这个轮子,而是通过这个例子来熟悉tensorflow的写法,并且测试笔者设计的一种新的softmax loss的效果,为后面研究语言模型的工作做准备。不同的地方word2vec的基本的数学原理,请移步到《【不可思议的word2vec】 1.数学原理》一文查看。本文的主要模型还是cbow或者skip-gram,但在loss设计上有所不同。本文还是使用了完整的softmax结构,而不是huffmax softmax或者负采样方案,但是在训练softmax时,使用了基于随机负采样的交叉熵作为loss。这种loss与已有的nce_loss和sampled_softmax_loss都不一样,这里姑且命名为random softmax loss。另外,在softmax结构中,一般是$\text{softmax}(wx+b)$这样的形式,考虑到$w$矩阵的形状事实上跟词向量矩阵的形状是一样的,因此本文考虑了softmax层与词向量层共享权重的模型(这时候直接让$b$为0),这种模型等效于原有的word2vec的负采样方案,也类似于glove词向量的词共现矩阵分解,但由于使用了交叉熵损失,理论上收敛更快,而且训练结果依然具有softmax的预测概率意义(相比之下,已有的word2vec负样本模型训练完之后,最后模型的输出值是没有意义的,只有词向量是有意义的。)。同时,由于共享了参数,因此词向量的更新更为充分,读者不妨多多测试这种方案。阅读剩余部分... 分类:信息时代 标签:深度学习, 词向量, word2vec 阅读全文 抢沙发 17 may 如何“扒”站?手把手教你爬百度百科~ 作者:苏剑林 | 发布时间:2017-05-17 最近有需求要爬一些儿童故事类的语料用来训练词向量,因此找了一些童话故事网把整站的童话文章爬了下来。下面分享一下用python实现的这个过程,并把之前爬取百度百科的经验,结合着分享出来。本教程适合于以下需求:需要遍历爬取指定的网站、并且指定网站没有反爬虫措施。在这种前提之下,所考验我们的仅仅是遍历算法和编程技巧了。假设再次表明我们的假设:1、需要遍历整个网站来爬取我们需要的信息;2、网站没有反爬虫措施;3、网站的所有页面,总可以通过网站首页,逐步点击超链接来到达。阅读剩余部分... 分类:信息时代 标签:爬虫, 语料 阅读全文 抢沙发 4 may 记录一次半监督的情感分析 作者:苏剑林 | 发布时间:2017-05-04 本文是一次不怎么成功的半监督学习的尝试:在imdb的数据集上,用随机抽取的1000个标注样本训练一个文本情感分类模型,并且在余下的49000个测试样本中,测试准确率为73.48%。思路本文的思路来源于openai的这篇文章: 《openai新研究发现无监督情感神经元:可直接调控生成文本的情感》文章里边介绍了一种无监督(实际上是半监督)做情感分类的模型的方法,并且实验效果很好。然而文章里边的实验很庞大,对于个人来说几乎不可能重现(在4块pascal gpu花了1个月时间训练)。不过,文章里边的思想是很简单的,根据里边的思想,我们可以做个“山寨版”的。思路如下:我们一般用深度学习做情感分类,比较常规的思路就是embedding层+lstm层+dense层(sigmoid激活),我们常说的词向量,相当于预训练了embedding层(这一层的参数量最大,最容易过拟合),而openai的思想就是,为啥不连lstm层一并预训练了呢?预训练的方法也是用语言模型来训练。当然,为了使得预训练的结果不至于丢失情感信息,lstm的隐藏层节点要大一些。阅读剩余部分... 分类:信息时代 标签:深度学习, 文本挖掘 阅读全文 抢沙发 1 may 【不可思议的word2vec】 4.不一样的“相似” 作者:苏剑林 | 发布时间:2017-05-01 相似度的定义当用word2vec得到词向量后,一般我们会用余弦相似度来比较两个词的相似程度,定义为 $$\cos (\boldsymbol{x}, \boldsymbol{y}) = \frac{\boldsymbol{x}\cdot\boldsymbol{y}}{|\boldsymbol{x}|\times|\boldsymbol{y}|}$$ 有了这个相似度概念,我们既可以比较任意两个词之间的相似度,也可以找出跟给定词最相近的词语。这在gensim的word2vec中,由most_similar函数实现。等等!我们很快给出了相似度的计算公式,可是我们居然还没有“定义”相似!连相似都没有定义,怎么就得到了评估相似度的数学公式了呢?要注意,这不是一个可以随意忽略的问题。很多时候我们都不知道我们干的是什么,就直接去干了。好比上一篇文章说到提取关键词,相信很多人都未曾想过,什么是关键词,难道就仅仅说关键词就是很“关键”的词?而如果想到,关键词就是用来估计文章大概讲什么的,这样我们就得到一种很自然的关键词定义 $$keywords = \mathop{\arg\max}_{w\in s}p(s|w)$$ 进而可以用各种方法对它建模。回到本文的主题来,相似度怎么定义呢?答案是:看场景定义所需要的相似。阅读剩余部分... 分类:信息时代 标签:词向量, word2vec, 互信息 阅读全文 5 评论 1234...103» 关于站长 bojone/282842712474 24岁,还在递增... 科学空间年龄:8年(2009.03.01至今) 数学爱好者 天文爱好者 理论物理爱好者 写作爱好者 对称性爱好者 计算机爱好者 中国象棋爱好者 厨房爱好者 更多内容请点击: 科学空间|scientific spaces 介绍 科学空间qq交流群:67729435 微信群|聊天机器人:spaces_ac_cn 搜索内容 如果要进行更为详细的信息搜索,跳转至google. 热门标签 转载 网站 天象 积分 力学 python 数论 节日 几何 方程 微分方程 费曼 复数 竞赛 生活 情感 翻译 引力 级数 素数 矩阵 流星 相对论 诺贝尔奖专题 向量 最新文章 互怼的艺术:从零直达wgan-gp 通用爬虫探索(三):效果展示与代码 通用爬虫探索(二):落实到论坛爬取上 通用爬虫探索(一):适用一般网站的爬虫 【不可思议的word2vec】5. tenso... 如何“扒”站?手把手教你爬百度百科~ 记录一次半监督的情感分析 【不可思议的word2vec】 4.不一样的“相似” 【语料】2500万中文三元组! 科学空间添加新域名kexue.fm 最近评论 ofey84: 其实从物理学的角度,没必要纠结是否可除。j^2=1的代数体系不可除,对应的物理性质是光速物体无... velkan: 感谢博主分享~ 我测试了一下,按照博主的方法最终分词效果目测可以接受~遇到2个问题: 1.转移... 懵懂: 感谢博主分享!50万的那个词典介意分享一下吗?不方便的话请问这么大的词典是如何构造的呢?人工筛... 潇然: 关于做qa这方面,苏神有没有什么相关的大致思路,最近做这个一直想用基于规则的方式,但又无从下手... halosir: 编程 苏剑林: ^_^ 苏剑林: 你说博客?还是编程? 小明: 搞懂了,是全概率公式-_-. robin: 你好强啊! robin: 有理想和追求的人,赞一个! 友情链接 宇宙驿站 科学松鼠会 数学研发 空间天文网 seatop 科学相册 xiaoxia 积分表-网络版 matrix67 丝路博傲 宇宙的心弦 物理问题 卢昌海主页 ifreethinking 朗道集结号 project euler aops 子谋的blog 青空天文社 tahoroom 山东大学天文协会 ph4ntasy 饭特稀 数学之家 acrafter 有趣天文奇观 天文地理知识 创造狮创意导航 申请链接 背景乐 no flash player! it looks like you don't have flash player installed. click here to go to macromedia download page. powered by flash mp3 player 本站采用创作共用版权协议,要求署名、非商业用途和保持一致。转载本站内容必须也遵循“署名-非商业用途-保持一致”的创作共用协议。 © 2009-2016 scientific spaces. all rights reserved. theme by laogui. powered by typecho 1.0. 备案号: 粤icp备09093259号。


Here you find all texts from your page as Google (googlebot) and others search engines seen it.

Words density analysis:

Numbers of all words: 352

One word

Two words phrases

Three words phrases

爬虫 - 6.82% (24)
网站 - 5.97% (21)
word2vec - 4.83% (17)
情感 - 3.69% (13)
gan - 3.69% (13)
向量 - 3.13% (11)
softmax - 2.84% (10)
作者:苏剑林 - 2.27% (8)
分类:信息时代 - 2.27% (8)
阅读全文 - 2.27% (8)
【不可思议的word2vec】 - 1.99% (7)
抢沙发 - 1.42% (5)
编程 - 1.42% (5)
转载 - 1.14% (4)
may - 1.14% (4)
天象 - 1.14% (4)
spaces - 1.14% (4)
评论 - 1.14% (4)
jun - 1.14% (4)
语料 - 1.14% (4)
robin: - 1.14% (4)
苏剑林: - 1.14% (4)
生活 - 1.14% (4)
矩阵 - 1.14% (4)
通用爬虫探索(三):效果展示与代码 - 0.85% (3)
通用爬虫探索(二):落实到论坛爬取上 - 0.85% (3)
通用爬虫探索(一):适用一般网站的爬虫 - 0.85% (3)
互怼的艺术:从零直达wgan-gp - 0.85% (3)
player - 0.85% (3)
【不可思议的word2vec】5. - 0.85% (3)
标签:网站, - 0.85% (3)
如何“扒”站?手把手教你爬百度百科~ - 0.85% (3)
scientific - 0.85% (3)
记录一次半监督的情感分析 - 0.85% (3)
登录 - 0.85% (3)
flash - 0.85% (3)
介绍 - 0.57% (2)
方程 - 0.57% (2)
all - 0.57% (2)
powered - 0.57% (2)
python - 0.57% (2)
宇宙驿站 - 0.57% (2)
积分 - 0.57% (2)
词向量, - 0.57% (2)
标签:深度学习, - 0.57% (2)
4.不一样的“相似” - 0.57% (2)
数学公式 - 0.57% (2)
ofey84: - 0.57% (2)
科学空间添加新域名kexue.fm - 0.57% (2)
velkan: - 0.57% (2)
感谢博主分享~ - 0.57% (2)
懵懂: - 0.57% (2)
【语料】2500万中文三元组! - 0.57% (2)
4... - 0.57% (2)
valid - 0.57% (2)
xhtml - 0.57% (2)
打赏latex天象链接博览相册目录 - 0.57% (2)
千奇百怪天文探索数学研究物理化学信息时代生物自然图片摄影问题百科生活/情感资源共享 - 0.57% (2)
潇然: - 0.57% (2)
halosir: - 0.57% (2)
--> - 0.57% (2)
科学空间|scientific - 0.57% (2)
google - 0.57% (2)
search - 0.57% (2)
有理想和追求的人,赞一个! - 0.57% (2)
你好强啊! - 0.57% (2)
^_^ - 0.57% (2)
你说博客?还是编程? - 0.57% (2)
小明: - 0.57% (2)
搞懂了,是全概率公式-_-. - 0.57% (2)
发布时间:2017-06-06 - 0.57% (2)
作者:苏剑林 | - 2.27% (8)
阅读全文 抢沙发 - 1.42% (5)
分类:信息时代 标签:网站, - 0.85% (3)
爬虫 阅读全文 - 0.85% (3)
标签:网站, 爬虫 - 0.85% (3)
分类:信息时代 标签:深度学习, - 0.57% (2)
may 【不可思议的word2vec】 - 0.57% (2)
抢沙发 1 - 0.57% (2)
通用爬虫探索(三):效果展示与代码 通用爬虫探索(二):落实到论坛爬取上 - 0.57% (2)
通用爬虫探索(一):适用一般网站的爬虫 【不可思议的word2vec】5. - 0.57% (2)
robin: 有理想和追求的人,赞一个! - 0.57% (2)
powered by - 0.57% (2)
robin: 你好强啊! - 0.57% (2)
小明: 搞懂了,是全概率公式-_-. - 0.57% (2)
苏剑林: ^_^ - 0.57% (2)
苏剑林: 你说博客?还是编程? - 0.57% (2)
halosir: 编程 - 0.57% (2)
2 评论 - 0.57% (2)
velkan: 感谢博主分享~ - 0.57% (2)
编程 苏剑林: - 0.57% (2)
记录一次半监督的情感分析 【不可思议的word2vec】 - 0.57% (2)
通用爬虫探索(二):落实到论坛爬取上 通用爬虫探索(一):适用一般网站的爬虫 - 0.57% (2)
互怼的艺术:从零直达wgan-gp 通用爬虫探索(三):效果展示与代码 - 0.57% (2)
^_^ 苏剑林: - 0.57% (2)
你说博客?还是编程? 小明: - 0.57% (2)
valid xhtml - 0.57% (2)
阅读全文 2 - 0.57% (2)
你好强啊! robin: - 0.57% (2)
搞懂了,是全概率公式-_-. robin: - 0.57% (2)
| 发布时间:2017-06-06 - 0.57% (2)
标签:网站, 爬虫 阅读全文 - 0.85% (3)
互怼的艺术:从零直达wgan-gp 通用爬虫探索(三):效果展示与代码 通用爬虫探索(二):落实到论坛爬取上 - 0.57% (2)
如何“扒”站?手把手教你爬百度百科~ 记录一次半监督的情感分析 【不可思议的word2vec】 - 0.57% (2)
阅读全文 2 评论 - 0.57% (2)
valid xhtml 打赏latex天象链接博览相册目录 - 0.57% (2)
编程 苏剑林: ^_^ - 0.57% (2)
苏剑林: 你说博客?还是编程? 小明: - 0.57% (2)
搞懂了,是全概率公式-_-. robin: 你好强啊! - 0.57% (2)
通用爬虫探索(三):效果展示与代码 通用爬虫探索(二):落实到论坛爬取上 通用爬虫探索(一):适用一般网站的爬虫 - 0.57% (2)

Here you can find chart of all your popular one, two and three word phrases. Google and others search engines means your page is about words you use frequently.

Copyright © 2015-2016 hupso.pl. All rights reserved. FB | +G | Twitter

Hupso.pl jest serwisem internetowym, w którym jednym kliknieciem możesz szybko i łatwo sprawdź stronę www pod kątem SEO. Oferujemy darmowe pozycjonowanie stron internetowych oraz wycena domen i stron internetowych. Prowadzimy ranking polskich stron internetowych oraz ranking stron alexa.