江海志
1年前 (2023-11-25) 1770浏览 0评论
Author: Cindy Marie Grimm
The process
The typical NSF panel I’ve seen is composed of about 1/4-1/3 people who have worked in the area at one point in time, but may not be active...
江海志
1年前 (2023-08-30) 2202浏览 0评论
首先来一句概括的总论:进程和线程都是一个时间段的描述,是CPU工作时间段的描述。是运行中的程序指令的一种描述,这需要与程序中的代码区别开来。
另外注意这里我说的进程线程概念,和编程语言中的API接口对应的进程/线程是有差异的。
下面细说背景:CPU+RAM+各种资源(比如显卡,光驱,键盘,GPS, 等等外设)构成我们的电脑,但是电脑的运行,实际就是...
江海志
5年前 (2019-10-06) 8702浏览 0评论
Google最近开源了基于TensorFlow的Learning-To-Rank(LTR)框架TF-Ranking。最初我很是兴奋。这是因为
LTR比目前常用的预测点击/转化的二分类算法,更加符合推荐系统的实际需求
我经常使用lightgbm, xgboost来进行LTR,但是GBDT天生只擅长处理稠密特征,而“稀疏特征”才是推荐、搜索领域中的“一等公民”。TF-Rankin...
江海志
6年前 (2019-06-04) 6551浏览 0评论
Handoff is part of Continuity, which is designed to make iPhones, iPads, and Macs work together more quickly, easily, and seamlessly than ever before. Rather than putting the same interfac...
江海志
6年前 (2019-03-05) 10703浏览 0评论
Link: https://dzone.com/articles/malware-detection-with-convolutional-neural-networ
In this post, we will learn about artificial network architectures and how to use one of them (Convolution...
江海志
6年前 (2019-02-17) 5680浏览 0评论
Hardware selection
转载请注明:江海志の博客 » Building a 4 way GPU workstation for machine learning/deep learning
...
江海志
6年前 (2019-02-08) 21522浏览 1评论
DNN指的是包含多个隐层的神经网络,如图1所示,根据神经元的特点,可以分为MLP、CNNs、RNNs等,下文在区分三者的时候,都从神经元的角度来讲解。MLP是最朴素的DNN,CNNs是encode了空间相关性的DNN,RNNs是encode进了时间相关性的DNN。
<img src=”https://pic3.zhimg.com/v2-80887c...
江海志
6年前 (2018-09-17) 466410浏览 1评论
Chrome 决定在版本70中隐藏地址栏里的www域名头部。虽说从用户角度来说,www加不加通常没区别,但从技术上来说,www和非www根本不是一个域,换句话说,它们完全是两个网站;这两个网站可能由同一个人控制,也可能由不同的人控制。如果是后者,隐藏www就会出现问题。
一个实际的例子是,www.net.cn是万网的域名,然而它和net.cn完全无关——net.cn是中国版的n...
江海志
6年前 (2018-09-10) 10913浏览 0评论
聚类
今天说聚类,但是必须要先理解聚类和分类的区别,很多业务人员在日常分析时候不是很严谨,混为一谈,其实二者有本质的区别。
分类其实是从特定的数据中挖掘模式,作出判断的过程。比如Gmail邮箱里有垃圾邮件分类器,一开始的时候可能什么都不过滤,在日常使用过程中,我人工对于每一封邮件点选“垃圾”或“不是垃圾”,过一段时间,Gmail就体现出一定的智能,能够自动过滤掉一些垃圾邮件了。...
江海志
6年前 (2018-09-04) 7289浏览 0评论
比较权威的计算机会议排名就是CCF的那个排名,大家可以参考。
这里列出大家公认的计算机分领域著名会议(又名:顶级会议,顶会)
Networking – SIGCOMM, NSDI, CoNEXT, MobiCom, MobiSys, WWW, INFOCOM
Measurement – IMC, SIGMETRICS, Performance, IWQ...
江海志
6年前 (2018-08-22) 3289浏览 0评论
考虑一个语音识别系统,假设用户说了这么一句话:“I have a gun”,因为发音的相似,该语音识别系统发现如下几句话都是可能的候选:1、I have a gun. 2、I have a gull. 3、I have a gub. 那么问题来了,到底哪一个是正确答案呢?
一般的解决方法是采用统计的方法。即比较上面的1、2和3这三句话哪一句在英语中出现的概率最高,哪句概率最高就...
江海志
6年前 (2018-07-03) 5520浏览 1评论
这几天在看有关multimodal learning(多模态学习)的一些内容,随之就牵扯出了boltzman机,mcmc(马尔可夫链蒙特卡洛)采样等一系列内容。总之mcmc采样是ml领域非常重要的一个理论,此外,目前能找到的书籍或网络资源很多说的都不是很清楚。所以我决定为此专门写一篇博客。
要去讲清楚一个算法或一个模型,通常首先得明确两点,一是使用它的背景,二是更具针对性的该...
江海志
6年前 (2018-06-29) 5147浏览 0评论
马尔可夫链及吉布斯抽样(Markov Chain Monte Carlo and Gibbs Sampling)详解
理解MCMC及一系列改进采样算法的关键在于对马尔科夫随机过程的理解。更多详尽的讨论请参见 重温马尔科夫随机过程。
对于给定的概率分布 ,我们希望能有便捷的方式生成它()对应的样本。由于马氏链能收敛到平稳分布,于是一个很nice的想法(by Metropolis,...
江海志
7年前 (2018-06-25) 3437浏览 0评论
机器学习十大算法之一:EM算法。能评得上十大之一,让人听起来觉得挺NB的。什么是NB啊,我们一般说某个人很NB,是因为他能解决一些别人解决不了的问题。神为什么是神,因为神能做很多人做不了的事。那么EM算法能解决什么问题呢?或者说EM算法是因为什么而来到这个世界上,还吸引了那么多世人的目光。
我希望自己能通俗地把它理解或者说明白,但是,EM这个问题感觉真的不太好用通俗的语言去说明...
江海志
7年前 (2018-06-19) 2972浏览 0评论
这或许是众多OIer最大的误区之一。
你会经常看到网上出现“这怎么做,这不是NP问题吗”、“这个只有搜了,这已经被证明是NP问题了”之类的话。你要知道,大多数人此时所说的NP问题其实都是指的NPC问题。他们没有搞清楚NP问题和NPC问题的概念。NP问题并不是那种“只有搜才行”的问题,NPC问题才是。好,行了,基本上这个误解已经被澄清了。下面的内容都是在讲什么是P问题,什么是NP...