The sharing of resources about Statistical Learning Theory and Machine Learning(includeing SVM,Semi-Supervised Learning,Ensemble Learning,Clustering) ,welcome to contact and communicate with me: Email: xiankaichen@gmail.com,QQ:112035246,

Monday, June 23, 2008

计算机博士交流群的一些记录(如何做学问)

校园商务平台(30940045) 22:13:10

dudu(562014591) 22:14:18
将一个算法直接替换成另一个算法“应用”于某一特例,然后自欺欺人地对比结果,就是烂论文
KaiBao-ML(112035246) 22:14:49

云海山人(57373880) 22:15:29
何为好论文?
dudu(562014591) 22:15:41
反命题
云海山人(57373880) 22:15:42
介绍点经验,
Leung-图形学(25728739) 22:16:15
如何反命题丫..介绍一下
怡外(260240477) 22:16:18
开创性的就是好文章
云海山人(57373880) 22:16:27
何为开创性的?介绍点经验,
校园商务平台(30940045) 22:16:51
我现在就打算这样写篇论文,哈
校园商务平台(30940045) 22:16:58
在琢磨中
云海山人(57373880) 22:16:59

怡外(260240477) 22:17:05
哈哈
KaiBao-ML(112035246) 22:17:19
开创性比较难哦
Leung-图形学(25728739) 22:17:30
将一个算法直接替换成另一个算法“应用”于某一特例,然后自欺欺人地对比结果,就是烂论文

得看什么特例了.....
校园商务平台(30940045) 22:17:52
我认为这是写论文,很重要的第一步,
云海山人(57373880) 22:18:14
next ?
SVM信息分类(14029756) 22:18:30
我不喜欢做纯粹的研究,做交叉应用好点
怡外(260240477) 22:18:34
我觉得,要从本学科的基本概念和基本定理开始
怡外(260240477) 22:18:56
结合其他学科
Leung-图形学(25728739) 22:19:07
如果有人发明了A算法,有人发明了B算法
但是我A+B用在某处,得到了好的效果
也应该算个好文章
怡外(260240477) 22:19:28
哈哈
Leung-图形学(25728739) 22:19:29
没有什么特别能开创的
我们都不是爱因斯坦
怡外(260240477) 22:19:54
我写了这样一篇文章
校园商务平台(30940045) 22:20:08
就是 显示模仿别人,掌握的了一定规律和心得后,再把自己的开创性的表现出来,我现在要结合自己的项目背景,先达到第一步
Leung-图形学(25728739) 22:20:42
就拿图形学来说,siggraph上面的很多文章
都算A+B+C+D+...的多重叠加
最多有一点点自己的自创
可以形成一个完整的工作,就是好文章
KaiBao-ML(112035246) 22:21:33
Leung-图形学(25728739) 22:19:07 同意
怡外(260240477) 22:21:37
我把计算机学报一篇文章和中国科学上一篇文章结合了
YJX-并行计算(24974976) 22:21:55
太有才了.
YJX-并行计算(24974976) 22:22:36
强强结合.
困惑-网格计算(9386619) 22:23:39
问君能有几多愁,恰似满仓中石油
c(12303108) 22:23:53
厉害啊
Leung-图形学(25728739) 22:23:54
当然,你自己发明一个A算法
直接发siggraph也是可以的
不过对于大多数研究者来说,只能做一些整合和小的改进
或者用在一个特殊的领域
比如,我会把小波用在曲面造型上面,不能说我这个工作很烂
怡外(260240477) 22:24:02

DW&DM(410224799) 22:24:57

(该用户免费使用手机QQ登录,详情请查看:http://mobile.qq.com/?from=qg)
KaiBao-ML(112035246) 22:26:42
要是我改进了某个算法之后,算法精度提高了一点,但不怎么提高,这算不算有改进
Leung-图形学(25728739) 22:26:49

KaiBao-ML(112035246) 22:26:55
怎么评价?
Leung-图形学(25728739) 22:27:10
看这个改进对于你这个应用领域的意义
校园商务平台(30940045) 22:27:14
那再改进些呀
KaiBao-ML(112035246) 22:27:53
我只对算法进行纯的改进,没有应用背景
沧海一粟(104589894) 22:28:17
困惑-网格计算(9386619) 22:23:39
问君能有几多愁,恰似满仓中石油

兄弟,我现在能去抄底吗?
KaiBao-ML(112035246) 22:28:18
试了好多方法,效果都不怎么明显
云海山人(57373880) 22:30:14
论文就是这么批量生产的!A+B+C+...
YJX-并行计算(24974976) 22:30:21
大幅度的提升和改进一般困难,否则别人也改进了.
在好期刊上按住一篇新点的文章,如果你的精度达到了它的,甚至超过一点点,那你就可以做好文章了.
二次加工,就是剩下来的功夫活了.
夏蛙的诱惑(7120043) 22:30:22
别啊,兄弟,今年很不真常
校园商务平台(30940045) 22:31:01
背景还是很重要的
Leung-图形学(25728739) 22:31:16
我觉得核心上很多烂文章都是这样的:
1、直接抄袭;
2、拿来用,但是和人家老掉牙的方法比
3、刻意说别人不好
4、数据作假
困惑-网格计算(9386619) 22:31:18
沧海一粟(104589894) 22:28:17
困惑-网格计算(9386619) 22:23:39
问君能有几多愁,恰似满仓中石油

兄弟,我现在能去抄底吗?

兄弟,我只是莹诗一句,不知底在何方哦
KaiBao-ML(112035246) 22:32:00
同意,我做了不少实验发现,结果并非它们所说的那么好
沧海一粟(104589894) 22:32:02

夏蛙的诱惑(7120043) 22:32:07
别吵阿.
YJX-并行计算(24974976) 22:32:46
许多好论文,在另外一个环境下,结果都有差别(这是很正常的),但文章仍然可以做.
校园商务平台(30940045) 22:32:47
这样的论文 会误导真正搞学问的人
夏蛙的诱惑(7120043) 22:32:51
底永远是底,庄家不会让你的手的
怡外(260240477) 22:32:58
引用了,不算抄呀。
Leung-图形学(25728739) 22:33:28
校园商务平台
这样的论文 会误导真正搞学问的人

什么意思?
YJX-并行计算(24974976) 22:33:29
原创性文章太少.很多文章大底如此.
KaiBao-ML(112035246) 22:33:42
但是现在困难就摆在这里呀,大幅度改进难,怎么能让算法有尽可能高的精度呢(就提高精度而言)?
YJX-并行计算(24974976) 22:34:02
当然有.
校园商务平台(30940045) 22:34:36
就是你所说的烂论文呀,假数据的论文
YJX-并行计算(24974976) 22:34:40
去年有一篇获奖论文(你可能不关心这篇论文),就是在众多好论文基础上,作了五个改进.
Leung-图形学(25728739) 22:34:41
小波提升你知道吗
它有个好处是可以做整数运算
整数运算就可以大幅度减少存储量
在计算机中精度可是很重要的
KaiBao-ML(112035246) 22:34:45

YJX-并行计算(24974976) 22:34:54
实际上就是细节上作了改进,但效果非常好.
Leung-图形学(25728739) 22:35:09
数据误差是有累积的
精度改进一点就是一点
Leung-图形学(25728739) 22:35:52
来图像去噪来说,提升0.5个db可以算好了
提升1~2个db,直接发transaction吧
KaiBao-ML(112035246) 22:36:09
比如说什么细节呢?
KaiBao-ML(112035246) 22:38:03

Leung-图形学(25728739) 22:39:21
有时候是某个参数可能只是调整了一点点,最终效果不同就是不同
举例试试:
在模式识别中,有的聚类算法是这样的
f(x) = a(x) + b(x) ...等等一个长式子
但是有人在f(x)后面加一项c(x),最后效果就不同了,这样子的文章也见过很多
校园商务平台(30940045) 22:40:00
嗯,。不错
YJX-并行计算(24974976) 22:40:14
所以说,某人读博1.5年,就为什么能够发36篇SCI,和24篇EI呢,其中就有些说法.
奋斗(329621457) 22:40:36
 所谓“有实际开发工作经验”是指你目前已经具备下列能力:1)你已经认为C++和汇编语言都是很简单的语言,并能够自如地运用;2)你能够在30分钟之内想到正确的五子棋AI算法设计思路和方向;3)你完全理解STL为什么这么重要;4)你能够独立地解决所有的编译与链接问题,哪怕你从来没有遇到的问题,你也不需要询问任何人;5)英文网站是你的首要信息来源;6)能够读懂英语写成的国际标准,比如NTFS磁盘格式标准。7)你经常站在集合论的角度思考算法问题;8)能够理解一个简单的驱动程序,能够理解一个简单3D交互程序;9)你能够认识到线性代数和概率论在实际编程工作中的极端重要性;10)你完全理解COM的设计思想,尤其能够理解COM为什么要设计成这样;11)当我说到虚函数的重要作用时,你不会急着去找书来翻;12)你能够说出C++为什么比其他语言优秀的理由,记住这种理由应该来自于你的开发体会,而不是因为其他人都这么说。此外还有很多判断标准,但如果你同时具备5条以上,可以认为你已经具备相应的开发经验了。在这种状态下读研,你将取得读研效益的最大值。
KaiBao-ML(112035246) 22:41:17

YJX-并行计算(24974976) 22:41:48
他告诉我,有些问题可以仔细去挖掘.其实很多问题研究细了,的确有很多问题.
校园商务平台(30940045) 22:42:15
Leung-图形学 提供的方法很值得我们去借鉴。
Leung-图形学(25728739) 22:42:24
继续举例:
高斯滤波器有个重要参数吧,delta,这个delta取得就有技巧了
你乘以个什么因子代进去都会很不同
以前有人搞双侧滤波器,就是两个高斯滤波(当然不是直接类同叠加),现在有人搞三侧的,就是多一些约束条件和参数
当然你试出来有好处就是你本事了
KaiBao-ML(112035246) 22:42:26
这牛人是谁
dudu(562014591) 22:42:27
1.5年,36篇SCI+24篇EI
YJX-并行计算(24974976) 22:42:44
暂时不要去评论论文的数量.
怡外(260240477) 22:42:48
做研究就是咬文嚼子了
YJX-并行计算(24974976) 22:43:04
那不是.你认为是小问题,可能它就不是小问题.
怡外(260240477) 22:43:51
开辟了新方向是很有可能的---1.5年,36篇SCI+24篇EI
YJX-并行计算(24974976) 22:43:53
因为,在这个群的所有人,看每个问题,都不敢说他自己能够确定某个问题是小问题还是大问题.你把它找到了,发现有用,可能就是大问题.
奋斗(329621457) 22:44:11
总之一句话,如果你只想成为软件开发高手(比如认为会编驱动程序或杀毒软件就是高手的那种),建议工作,不要考研;完全没有工作经验的,也不建议考研,你进来了只有瞎混一通。如果你有上述工作经验且想成为高级软件工程师(能够独立理解并设计出快速傅立叶变换算法的那种软件工程师)的话,那么强烈建议考研。考研让你有3年放松思考的机会,也有3年让你思想和技术积累沉淀的机会。非常难得的机会。不考研的话,这种机会就是一种奢侈,可望而不可及的那么一种奢侈。1 B7
YJX-并行计算(24974976) 22:44:45
至少这点,我在最近大量实验中,就发现了这点,许多文献中的结果,实际上没有考虑到另外一个角度.

Leung-图形学(25728739) 22:44:56
同意
奋斗(329621457) 22:45:30
关于实战经验与理论学习的优劣问题。这没有定论,如前所述,管理信息系统,设备驱动开发,工具软件开发,软件病毒剖析等等这些工作不太需要创造性,需要的是耐心和经验,需要的是对既有规范的准确理解,这类开发工作最适合在实战中提高,理论学习没什么作用。但是在人工智能,模式识别,图像压缩,虚拟现实,巨量数据检索,自然语言理解,计算机图形学等等领域,理论学习就占据着绝对的统治地位!这些领域的突破对人类的生活的影响是极其巨大而深刻的。某些领域处于一个极其快速发展的态势之中,比如计算机图形学,相信诸君能够从众多3D游戏的灿烂辉煌中体认到我的这种说法。在这些领域,如果没有扎实的理论功底,一切都是那么遥远,不管你花了多少时间在编程上面。! F: j. }7 ^2 w! S$ d( ~
  
" S. w3 P- S* J# j9 e; F7 U
Leung-图形学(25728739) 22:45:48
你在一个狭小的角度发现问题,在这个里面有改进就行
别管最终应用的面会有多窄
也许可能就是在某些特例上有用,那也是有价值的
怡外(260240477) 22:46:25
如果所有因素都加进来的话,问题可能会很复杂,所以21世纪是复杂科学的世纪
YJX-并行计算(24974976) 22:46:39
我当年的导师在本科时,就是这样发现了一个很狭小,很偏,很理论的一个问题,所以他当年发了5篇顶级期刊论文.
YJX-并行计算(24974976) 22:47:43
至今让我不敢忽略一些自认为不重要的问题,除非我对那个问题搞得很明白.
怡外(260240477) 22:48:07

KaiBao-ML(112035246) 22:48:08
同意,收益匪浅阿
YJX-并行计算(24974976) 22:49:30
的确有大气,大手笔的文章,并且可能是几页的.但太多的顶级期刊论文,都在很详尽的讨论一些细致的问题.
说白了,就是研究做得还是够量.本质上就是这样.
Leung-图形学(25728739) 22:49:47
系统
Leung-图形学(25728739) 22:50:13
做全做透
校园商务平台(30940045) 22:50:24
讲下这个过程
校园商务平台(30940045) 22:50:49
可以描述下当初的这个过程么?
YJX-并行计算(24974976) 22:51:24
一个教授把Nature上的一篇文章看透了,为了针对那篇文章,详细地做了另外一篇SCIENCE文章,做得非常够多的工作,足足26页的文章,录用了.
dudu(562014591) 22:52:00
哎!还是想想我们怎么毕业吧
Asian Engine(372760127) 22:52:18
同意
YJX-并行计算(24974976) 22:52:58
不说了,再说,就没有意思了.我得修改文章了.
YJX-并行计算(24974976) 22:53:18

校园商务平台(30940045) 22:53:25

KaiBao-ML(112035246) 22:53:35

No comments: