ICCafe Singapore

ICCafe Singapore

Share

IC Cafe Singapore provides a much needed refuge where likeminded people can sit, chat, compare notes, and share their stories.

IC Cafe Singapore is setup in year 2014 by more than 40 professionals with ample experience from IC, IT industries and national research institutes from Singapore. Majority of those professionals are currently withhold middle to senior management role and 70% of them are master and doctorate degree holders, companies include: 3M, SSMC, Micron, UMC, STMicroelectronics, GLOBALFOUNDRIES, UMC, SSMC, Q

世界区块链大会(WBF).三点钟峰会 30/05/2018

IC咖啡.新加坡首次与世界区块链大会和中国最具影响力的“三点钟区块链”社群合作,并联合新国大等二十多家机构和单位,共同打造世界区块链大会•三点钟新加坡峰会,欢迎来自区块链行业世界各国及各地区的行业领军人物、名人大咖、专家学者、技术极客们!预计将有两千多人参加本次峰会,届时名人云集,是一次绝佳的区块链行业分享和投资机会与学习机会!

世界区块链大会是全球区块链领域的顶级行业盛会,被业界誉为区块链的“达沃斯论坛”。作为世界区块链大会全球行第二站的新加坡峰会,将于2018年6月8日-9日在新加坡金沙酒店举办。
( http://cn.mikecrm.com/tR2LLTi )

新加坡的朋友们有福了,IC咖啡.新加坡将送出若干价值6800元人民币的免费门票,数量有限,现在开放登记,请马上点击这里报名: http://cn.mikecrm.com/mFobgyA , 入选的朋友将会在本周末获得邀请,我们世界区块链大会新加坡峰会见!

世界区块链大会(WBF).三点钟峰会

30/05/2018

IC咖啡.新加坡首次与世界区块链大会和中国最具影响力的“三点钟区块链”社群合作,并联合新国大等二十多家机构和单位,共同打造世界区块链大会•三点钟新加坡峰会。

Photos from ICCafe Singapore's post 17/07/2016

Take note that every 2 weeks ICCafe Sat afternoon 2pm will have a sharing. This week we have invited Jack Woo who founded Bigdeal (sold to NTUC), Xcape (you should have heard of it) and most recently the Weekendgowhere.

12/07/2016

This Saturday, talk by Jack Woo.
The Co-founder of Bigdeal & Xcape.
At 21 Woodlands Close #05-35 Primz Bizhub.
Singapore 737854
Do not miss out this exciting talk

LIVE NOW! I am broadcasting on Rings. 17/10/2015

LIVE NOW! ICCafe SGP is broadcasting on Rings.Watch #深度-中药大数据分析 # from here: http://rings.me/s/10007888/v2147

LIVE NOW! I am broadcasting on Rings. Rings broadcast live video and get the entire world to watch you. Broadcast yourself or become a fan and chat and view the most popular trending channels and make new friends.

中国创新之都探秘 @ IC CAFE Singapore 01/05/2015

世界创新之都在哪里?美国硅谷。
中国的创新之都又在哪里?中关村?浦东?No, 是30年前的小渔村深圳!
在深圳这个“硬件的好莱坞”,创客们为各种奇思妙想赋型,而这些奇思妙想,正寄寓着深圳的雄心——从“山寨之都”到“设计之都”,再到“创新之都”。
2015年4月,IC咖啡新加坡组织了一支智能硬件考察团,去往这个被世界惊呼amazing的创新基地,一探究竟。
一周的探访下来,让我们渐渐把住了深圳的创新之脉:完整细致的产业链+接地气的市场驱动+政府的各种扶持+地产商等的大小资本注入,等等。
细考,还有哪些?请移步IC咖啡,来听考察团的观后分享。

分享人员:

张向东(软银中国合伙人)、王华磊(LongCube联合创始人)、William Pok (WAN Global Ventures, Managing Director)、范祎(360IC联合创始人)、吴比(南洋艺术馆董事总经理)李文博(ST资深经理)、陆梅君(GLOBALFOUNDRIES技术经理)、董业民(SiliconHub联合创始人)

考察行程:

4月13号:环球资源、安芯商城、贝乐天成
4月14号:摩尔实验室、拓邦股份、远望谷
4月15号:银星智能扫地机、桑格尔、五株科技(PCB)
4月16号:国际创客中心(柴火空间、中科创客学院等)、硬蛋网、前海孵化器
4月17号:柔宇科技、思锐达传媒、洛可可工业设计

时间:2015年5月2日 周六下午 2pm – 5pm


地点:21 Woodlands Close #05-35, Primz Bizhub Singapore 737854

费用:$10 (提供茶水点心,在校大学生半价)

http://www.iccafe.sg/%e4%b8%ad%e5%9b%bd%e5%88%9b%e6%96%b0%e4%b9%8b%e9%83%bd%e6%8e%a2%e7%a7%98

中国创新之都探秘 @ IC CAFE Singapore 世界创新之都在哪里?美国硅谷。 中国的创新之都又在哪里?中关村?浦东?No, 是30年前的小渔村深圳! 在深圳这个“硬件的好莱坞”,创客们为各种奇思妙想赋型,而这些奇思妙想,正寄寓着深圳的雄心——从“山寨之都”到“设计之都”,再到“创新之都”。 2015年4月,IC咖啡新加坡组织了一支智能硬件考察团,去往这个被世界惊呼amazing的创新基地,一探究竟。 一周的探访下来,让我们渐渐把住了深圳的创新之脉:完整细致的产业链+接地气的市场驱动+政府的各种扶持+地产商等的大小资本注入,等等。 细考,还有哪些?请移步IC咖啡,来听考察团的观后分享。

07/03/2015

没有过硬的技术和对行业的深刻理解,就别谈大数据

在开始这篇文章前,我有必要首先阐明下我对大数据的意义的理解。所谓大数据,无非是对我们能够获得的海量数据信息进行合理的分析和统计获得有参考价值的结论,以为我们的各种决策提供有价值的参考。

虽然大数据这个概念在近几年才开始变得热门起来,但事实上,在各个领域中对大量数据的分析和应用的方法是一直以来都被广泛采用的。记得早在上个世纪,我还是一家集成电路制造厂的工程师的时候,就一直会在各种场合或领域使用到数据的分析。无论是改善工艺条件,还是降低物料消耗都会通过对大量实际量产数据进行分析来获得结论。工厂甚至有一套CIM系统(ComputerIntegratedManu-facturing)能够自动监控所有设备的工艺条件和产能效率,通过对所有设备稼动率和生产效率的综合计算,可以预估后面数周的产品入库量,以帮助管理者制定生产、采购计划,预防风险和发现生产瓶颈。

当然我们日常生活中对数据分析的运用远不止此,甚至一个主妇通过计算近几个月家庭日常流水来规划未来家庭支出计划都可以看作是一个对数据分析的实践案例了。

既然对大量数据进行分析的方法一直以来都广泛存在,那么为什么当互联网、特别是移动互联和物联网崛起的今天,大数据突然又变成了一个如此火热的话题呢?

要回答这个问题,就需要看看互联网、物联网的高速发展客观上给人类带来了一个怎样的产物,那就是惊人的海量数据。曾经,一个家庭主妇每月也就处理上百个数字,一个商店也许是每月上万数据,即使是一个大型的现代化工厂每天面对的各种数据也许只是用数以万计来描述,然后到互联网高速发展的今天,随便一个大型网络公司每天处理的信息数据就可能是数以万”G”来形容了(大家可以想象一下腾讯的微信服务器每天光无聊的食物自拍照片就要吞吐多少字节信息)。可以毫不夸张地说,人类最近几年创造的数据信息已经超过这之前几千年所有数据的总和不知道多少倍了。更为重要的是,大数据的概念并不仅仅局限在单纯的数据数量上的几何级增加,更多的是数据的种类和维度–人类社会中的每一个指标或者行为都会成为我们所需要参考的数据。

如此之大的数据已经不能用海量,而是要用天量来形容了。那这必须用天量来形容的巨大数据之中有蕴含了多少有价值的信息呢?如何去挖掘这个貌似蕴藏量无限的金矿,成了人们非常感兴趣的话题,这也是大数据突然成为热门话题的根本原因。

那接下来的问题就是,为什么非要通过大数据的分析来获取信息呢?大数据挖掘的信息和传统的”小数据”分析究竟在结果上有何本质差异呢?

要回答这个问题,首先我们需要来了解一下两个最基本的概念:信号与噪声。

那么什么是信号,什么又是噪声呢?提及这两个名词,很多人脑海里可能会浮现出小时候用过的信号质量不佳的半导体收音机的形象,然而信号与噪声的概念在这里远不止此。简单而言,信号就是所有信息里,符合我们需要,能够为我们对事务的判断提供正确引导的那部分,而所有会干扰和影响我们判断的信息则都为噪声。

我们可以通过一个形象的比喻来正确理解这两个概念,当你坐在一个环境嘈杂的饭馆里和你朋友聊天时,你必须全力关注于你朋友的话语,而尽可能减少周围其他人的语音对你听力的影响。这种情况下,你朋友的话语就是信号,而周围人群的声音则皆为噪声。同时也由此可见,针对不同场景的具体需求,信号和噪声都并非绝对,在一定情况下是可以互换的。你朋友的话语对你来说是信号,而对于邻桌说话的人来说则是噪声。数据分析、特别是大数据分析的意义就在于帮助我们从海量的被各种噪声所淹没的数据信息里提炼出有意义的信号,从而使我们能够获得结论。

在客观的世界中,任何一个结果的形成都会由很多个因素所影响。这个”很多”理论上可以接近无限多,因为从混沌学的角度上讲,任何事物之间都可能存在微妙联系。众所周知的蝴蝶效应”是中国的一只蝴蝶闪动翅膀,也可以导致美国加州的一场飓风”就是一个不错的注释。一个更为具体的案例是:当我们需要估计一家便利店里一段时间啤酒销售量的时候,就需要考虑诸多因素,比如附近其它竞争商店的多寡、最近的气温高低、周围人口数及人口性别和年龄的分布、最近体育赛事的频度,这些都会严重影响便利店的啤酒销量;然而更多的可能是各种随机的干扰,比如某些突发酒瘾的单身汉或者家里组织BBQ聚会的人家,也或者偶然路过的旅行团……。所有的这些都会对销售额产生影响,当我们需要估算商店选址是否合理、促销手段是否有效时,这些影响都会干扰我们的判断。而需要尽可能减少这些干扰影响和话,我们就需要大量的数据来冲淡各种偶然因素的影响权重。这个时候,我们就真的需要大数据了。

既然一个事物或现象的结果是在许多个因素以及随机噪声共同作用下形成的,我们可以抽象地把它用公式表示出来:

Y=F(X1,X2,X3,…….Xn)+N

其中,Y代表结果,X1到Xn分别代表n个已知的因素,N代表随机噪声。Y的结果与所有因素的关系其实就是个确定的多元函数和噪声组合的关系。其实,所谓的噪声也是由无数个我们还未能认知的小因素组合而成。这些小因素数量繁多,但各自独立影响较小、难以确认,所以组合在一起以后,从宏观效果上看就可以认作是一个完全随机(无论是频域还是时域)的干扰。

过去在没有大数据的时代,我们在研究事物规律的时候,往往由于没有足够数据或信息的支持,所以把注意力集中在有限的几个重要因素上,假设只有X1和X2,这样的情况下X3到Xn的其它所有因素都被归结到噪声范畴。这样一来,这些其它因素变化而对结果带来的影响就都变成不可预测的干扰,严重影响判断的精度。以前面啤酒销售的案例为例,如果我们只能根据商店的位置、和周边居民人口数来估算每月啤酒销售预期的话,就会产生严重的误差。因为天气的温度也会影响啤酒销量,而人口数中啤酒的主要消费者青壮男性的比例数也是重要影响因子,其它比如最近有没有世界杯比赛、某品牌啤酒最近一段时间营销力度也都本应该作为认真考虑的指标。然而可惜的是,传统的模式下(缺乏海量数据的支持的情况下),我们要想把所有因素都考虑进去显然是不可能的,或者是成本巨大的。

所以我们要感谢互联网的出现。正式由于互联网的出现,使得我们获取数据和信息的成本变得非常低,以至于我们可能方便并迅速地收集各种海量情报数据,通过高性能的计算机分析后及时得出我们需要的结论。在很久以前的传统电视机时代,我们很难了解到电视节目精确的收视情况,更无从了解每台电视前坐着哪些人、这些人有哪些消费习惯和偏好,所以也不可能因此去调整广告内容还取得更好效果。然而在互联网时代,当无数个电脑使用者在上网的时候,所有的这些被网站记录下来的貌似杂乱和无序,但数量极其巨大的操作信息里,恰恰包含了整个市场的消费者的重要信息,如果加以合理的分析,则将会为商品供应商提供最重要的参考。供应商很容易就通过用户的操作记录收集到他们的收视习惯甚至其它的一系列比如食物口味、衣服式样颜色品味和其它消费偏好的信息,于是可以迅速及时地做出反馈,及时调整购物网站产品内容和广告形式,从而提高销售业绩。

而当移动互联和物联网兴起以后,我们能够收集到的数据量又会呈现一个几何数级的飞跃。以一个简单的手环为例,只要用户持续使用,它就会不断地提供用户的位置、活动状态、睡眠质量以及脉搏血压等各种数据。这里面光是和用户健康指标相关的信息会有多少?过去,一个健康者可能一年才体检一次,也只能提供一份数据,而现在则可能是一年365天里每分钟都在提供着数据。这对于健康医疗、保险以及相关产品的销售者来说不啻是一个巨大的金矿。大数据时代,我们需要做的就是把这些金矿挖掘出来,认真提炼,变成真正的金子,为我们所用。作为大数据应用的价值,由此可见一斑。

那么,接下来的问题是,我们应该如何应用大数据呢?或者换句话说,我们要通过怎样的实践方法,才能通过海量的信息获取我们所需要的结论呢?

其实抽象地总结来说,大数据的应用主要应该包含以下几个步骤:

1)对样本信息的标准化和量化

2)对量化数据的收集和分析

3)根据分析结果对目标结果进行预测并对我们的决策提供有效参考

首先是对样本信息的标准化和量化,也就是要把那些我们感兴趣的或者有帮助的各种信息变成有明确意义的数值,以便电脑的收集、计算、分析和处理。虽然我们比较容易定性地判断一个顾客对一件衣服是否喜欢和满意,但却无法把这种喜欢程度以数据的方式让电脑知道,更无从进行分析和归纳。但是在物联网时代,我们完全可以通过IFID等技术手段去统计一件衣服每天被多少顾客拿进试衣间,又有多少比例形成了购买行为,甚至我们有可能知道每件衣服被顾客试穿的时间是多少,这些数据如果归纳在一起,我们就有机会建立一个算法模型来量化顾客对衣服的喜好程度。

另一个例子中医对病症的诊断。中医往往需要通过望闻问切一系列主观方法去收集人体生理指标进行判断。未来如果我们要一大数据的形式进行健康管理的话,首先就需要把这些主观的生理指标变成客观数值。比如说舌苔的颜色是一个重要的指标,但如何让它变成电脑可以进行识别和分析的数据呢?是否可以通过光学传感器模组把舌苔拍成照片,在通过图像算法变成一系列的客观数值呢?这是一个非常值得探讨和研究的话题,因为只有做到这一点,大数据的第一步数据收集才能够得以实现。

这里顺便说一句,由以上两个例子可以看出,未来大数据时代物联网和传感器的技术会起到多大的作用。这两个行业目前也之所以能够方兴未艾,其理由也是不言则明了。

其次就是对量化数据的收集和分析了。这一步骤或许是技术层面上最麻烦的一步了,尤其是数据的分析。其实数据分析最重要的一个目的就是研究和总结不同事物间的关联性:比如国际原油价格的走向和A股指数之间了关系。一旦我们掌握了两者之间的关联或者规律,我们就可以比方说通过过去一个月的是有价格判断某些股票价格未来的走向的可能性。然而有本文前面的公式可知,任何一个事物的结果都是同时收到许多个因素的共同影响,而且其中有大量的随机因素共同形成的巨大的无法预测的噪声存在,这些就会给数据的分析和规律寻找带来巨大的麻烦和困难。

一般最简单的排除噪声干扰的方法就是在预知或预估事物间关系函数模型的基础上用求平均值的方法获得拟合曲线,从而能判断最佳的函数参数值。这种方法最大的特点就是需要大量的实测数据的支持来抵消噪声对单个数据的干扰–数据越多,从概率上来讲就能使误差越小。

通常如果只考虑单一因素关联性的情况下,我们需要的数据往往并不算很多。通常从几百到上万组数据里,我们就完全有可能计算或推导出有参考价值的关联信息了。然而当考虑的因素变多的时候,问题就发生了本质性的变化。比如,如果只计算一个因素影响函数的时候需要1000组数据的话,那考虑个因素的时候,整个样本空间就由一维空间变成了两维,理论上就需要的数据量不是2000组,而是1000的平方一百万组。以此类推,如果是需要考虑n个因素的时候,那我们需要的数据就变成了1000的n次方程了。当考虑因素很多的时候,以目前的硬件技术和能力,恐怕也难以完成这么大的计算。

所幸的是,我们通常并不需要如此之多的数据。比如一张图片,我们并非需要凑齐每个像素点,才能分辨图片的内容。理论上一张图片的内容如果不是完全杂乱无序的话,我们只需看到部分的图片也基本上能够猜到整张图片里究竟是什么东西。大数据分析也是如此,如果我们预先对数据之间的关联性规律有所认识和理解,并以此建立正确可靠的数学模型,就可以在数据量相对有限的条件下,推论出合理的函数参数。

一个简单的例子是,如果我们能够假设在一定范围内,天气的温度和冰淇淋的销量成简单正比关系的话,就可以用一个一阶的函数来建立相关性模型:Y=aX+b。其中Y是冰淇淋的销量,而X是天气温度。而我们通过大数据需要分析和探索的就是参数a和b的具体大小。当我们在各种天气温度条件下收集到足够多的冰淇淋销售数据的时候,就不难通过最小二乘法等简单数学工具来获得a、b的值。虽然单组数据都不免因为受到各种其它噪声因素的影响而有所偏离,但在较多数据的平均下,噪声干扰会被最大限度地抑制。所以我们·不仅可以得到比较可靠的a、b的数值大小,甚至可以定性了解到结果的可靠性有多高。

当然,实际的情况一定会比我上面的例子要复杂许多。不一定所有因素之间的关系都是简单的线性关系,而且在不同区间和客观条件下,这种关系也可能发生改变。特别是参考我再前面的公式,一个结果往往是由许多个因素工作作用决定的时候,这种数学模型的建立则有可能变得异常复杂。更有一些情况下,我们很难在理论层面上预设某两个因素之间具体的关联函数,这时候就只能依赖经验进行猜测了。虽然也有一种说法,未来的技术可以在理论层面完全不了解事物之间关系的时候,单凭大数据的分析也可以获得有意义的结论,但这种情况目前还多只是一个美好愿望。在目前及不太久的将来,大数据的分析还主要依赖三个基本要素:1)合理的数学模型、2)正确高效的算法、3)足够多的数据样本

最后就是如何利用分析的结果进行决策了。虽然,在大数据应用的三个阶段中,纯技术含量最高的部分都集中于前面两部(数据收集和数据分析),但真正体现和产生价值的却完全在于这第三步骤。可以说,如果大数据分析的结论不能够对我们的行为和决策做出任何影响,那所有的工作其实都是没有意义的了

在以大数据分析结果为依据进行觉得的时候,必须掌握的一个基本要点就是所有根据大数据分析得出的预测都是概率性的结果。比如某个客户在采购时,选择某款衣服的概率是80%还是20%。这是由于数据重的噪声以及各种不确定因素的干扰导致的。虽然我们可以通过大量数据的应用,在最大限度上抑制随机因素的影响,从而获得比较准确的因素间关联特性,但在一次为基础对特定情况进行推测时,我们依然无法排除随机因素对特定目标的干扰。我们日常生活中最常见的这种情况就是天气预报。虽然我们已经掌握先进的卫星技术和应用最先进的并行计算设备对天气进行详细分析,但在预测某地第二天是否降雨时还是采用降雨概率的形式播报。根据大量的历史数据统计和分析,人类已经可以比较准确地预测某地在一段时间(比如一年内)内总的降雨量或者发生6级以上地震的概率,但要预测具体哪天下雨或者有地震,却依然没有好的方法

不过这种概率性的结果已经可以为我们提供有足够价值的参考了。比如针对电脑前的一个网民,如果我们知道哪些广告对其消费行为影响可能性最大,就可以有针对性地播放广告,给白领男士看汽车广告、把化妆品广告播放给女人、针对儿童可以选择各种玩具和食品的广告,甚至我们可以调整广告时间和形式以获得更高的成功概率。这相比于原来的无差别的统一投放来说,在总体成功概率和效率上一定会有提高

一般而言,分析的数据越多、越深入,我们获得的概率的准确性就越高,从而使得效率的提升也越明显。但这种提升是以付出巨大成本为代价的。通常而言,提升预测精度一个档次,所要分析的数据量和投入的计算量就会成倍数增长。预测精度和与车成本成指数级的递增关系,也就是说,当预测精度要求达到一定程度时,其预测的成本就会迅速超过我们可承受的程度,以至于在技术没有突破性进展的前提下,要想获得过于精准的预测结果几乎是不可能的。

不过所幸的是,我们通常并不需要非常精准的结论才可以进行决策。预测的一个基本原则是,一个能够迅速简单地获得的粗略的估算结果会比一个需要大量成本和时间获得的相对精准的结果更有实际价值。当我们再决定是否可以投资一支股票的时候,我们其实只要知道其股价在未来的一段日子里会有较大概率上升(比如股价在未来三个月有80%的可能上升约20%~50%)就足够帮助我们做出购买的决策了,至于其上升比例是27.3%还是33.6%其实并不十分重要。即便我们投入大量资源去计算一个更为精确的上升比例,也不会改变我们的决策,因为我们的决策其实只是在买和不买之间进行选择。如果盲目追求精度,不仅会浪费大量无意义的成本,甚至可能因为花费过多时间而错过机会(当你计算完股价精确的涨幅的时候,股价可能已经涨过你能接受的价格了)。

最后,我们有必要再总结一下大数据应用的整个流程。总体而言,大数据引用就是,对所有相关的因素进行量化和尽可能多和准确地收集这些数据并通过建模和算法来分析各个因素之间的关联规律;根据分析出的规律对未知因素的值进行概率性的预测;并根据预测的结果来指导我们的行为,帮助我们做出最有利的决策。

由此可见,大数据应用的本质并不复杂和神秘。它是传统数据挖掘技术和海量存储检索技术发展到一定阶段的自然产物。更多的时候,它不仅仅是一种技术,而是一种思维方式。然而在实际应用中,其未来的发展和实际应用不仅在技术上还有诸多的难点和门槛需要克服,同时又需要我们对具体行业或领域有深刻的理解。在这两个方面如果没有足够积累的话,大数据能够真正走进我们日常的工作,恐怕还有待时日了。

文:关牮,思比科微电子高级测试经理。专注于高端SOC集成电路等测试方案开发,管理和数据分析等工作。

Want your school to be the top-listed School/college in Singapore?

Click here to claim your Sponsored Listing.

Location

Category

Telephone

Address


Primz Bizhub, #05-35, IC CAFE
Singapore
737854