最新内容
文章: 291
阅读: 1036728
今日阅读: 411
今日访客: 367
clickhouse中使用AggregatingMergeTree表引擎
最近一段时间,开发一个数据分析系统,使用Clickhouse作为数据仓库,完成对数据的存储、查询和统计。关于Clickhouse的介绍,可以参看它的官网:https://clickhouse.com/。或者是之前发表的这篇博文:ClickHouse原理解析与应用实践。这篇文章只介绍它众多表引擎当中,比较常用的一种:AggregatingMergeTree。
最近这些年大数据发展迅猛,涌现出了一大批以Hadoop为核心的大数据组件,包括HBase、Hive、Pig、Flume、Spark等。我们公司在前些年也基于Hadoop构建了一套基于Kafka+Spark+HDFS+Mongo的数据系统,然而近几年却感觉这套系统越来越力不从心了。因为它主要是以T+1的模式,隔日进行清洗,少部分核心指标通过Spark Stream进行实时的、预定义的运算。难以满足业务部门提出的实时的、自定义维度的查询。因为一旦涉及到自定义维度,就不可避免地去查询明细数据,而通过Spark作业对明细数据进行运算和统计,其实时性又无法达到要求。
这本书讲了一个真实的故事。一位社会学的老教授,在患病去世前的十几周里,在每周的星期二,约见自己之前的一位学生,向他传授人生中的最后一课:讨论生活的意义,关于家庭、工作、感情、衰老、死亡、遗憾、原谅等重大议题。这本书只有200页厚,但我觉得可以继续压缩到100页,因为书中做了太多的背景交代和铺垫,尤其是老教授的身体逐渐衰败的过程,他的生命火烛在一点点的熄灭,几乎每一个章节都花了不少篇幅描述。作者的核心观念还是奉献爱,爱身边的人,关注自己所在的社区。这和之前看到的一个TED关于幸福的演讲是类似的,只有和重要的人建立良好的亲密关系,才会感觉到幸福。
这是一本很老的书,我在大概十年前就读过这本书的电子版。只记得这本书在炒股之外,讲了很多关于人性的东西。比如说,人们总是受到两种情绪的支配:贪婪和恐惧。无意中看到这本书出了新版,就又买来重读了一遍,更新的内容并不是很多。这本书分享了作者在华尔街炒股几十年的经验和感悟,关于价值投资、技术分析的内容讲得不多。作者是以炒股为生的,很多经验我觉得更适合全心投入这一行当的人。对于普通人来说,还有日常的工作,我觉着最简单的办法,就是买几支基金就好了。以100元的进价买入一支股票,它可能跌到5元直至退市;但买入一支基金,本身就包含了很多支股票,并且基金经理会根据个股的表现进行调仓;而如果购买指数基金,则会按照指数构成进行自动调仓。所以,股票可能会死掉,但基金长青。
这本图文并茂的西方艺术史,以时间为序,讲了各个时期的代表艺术家以及他们的作品。时间从两三万年前的西班牙阿尔塔米拉洞穴壁画,一直到近代的超写实主义。介绍的范围,大多数为画作,也有少量的雕塑和建筑。既然是“大话”,那么语言上自然是通俗易懂的,且讲了很多不为人知的趣事,比如说最早的艺术居然是为了诅咒:阿尔塔米拉壁画上的牛,都是受伤的,因为当时还是狩猎时代。同类型的书,除了这本以外,我还看了蒋勋写的《写给大家的西方美术史》,以及《小顾聊绘画》。总的来说,这三本书读起来都挺轻松,内容也很相似,有时候同一本书反复读会比较枯燥,这样读同一主题的不同书,既能加深印象,又更加有趣一点。
很早前就看到过这本书,打开京东图书的畅销榜,在“励志与成功”分栏,这本书差不多是常年霸榜。因为起初以为是佛学方面的内容,所以一直都没有引起我的兴趣。直到最近在豆瓣上搜索“极简主义”相关的书籍,这本书又进入了视线,于是就买来读了。因为我之前已经读了《我决定简单地生活》和《简单生活的艺术》。所以再读这本书的时候,感觉全无新意,依然是舍弃物品的那一套理论,所以花了两个小时,快速地翻阅了一下。根据作者的介绍,以及推荐序,可以得出这本书应当是“极简主义”的鼻祖,作者最近这些年一直在全球演讲,推广其生活理念,影响到了很多人,当然,也改变了作者本人的后半生吧。
这本书是关于“极简主义生活”主题阅读的第二本书,我在豆瓣上搜索了和“极简主义”相关的几本书,评分普遍都不是很高,这本算是评价相对好一些的。作者是位法国人,全书大概分为了3个部分,分别讲了极简给精神层面带来的愉悦、为什么人们喜欢囤积物品和如何破除清理物品的心理障碍、具体应当如何以及清理掉哪些物品。关于极简主义,本书的核心思想其实也是一样的,仅保留生活最少限度的必需品,人们常常难以割舍的“纪念品”、“馈赠品”、“礼物”,只要克服一点心理障碍,都是不值得保留的。这本书相对于《我决定简单地生活》,读起来乏味一些。
最早接触“极简主义”生活,2014年的时候看到的一篇微信文章:极简主义生活方式。之后不彻底地实践了一段时间。总的来说,我还是非常认可这种极简主义的价值观和生活方式的。因为这个理念相对简单,所以我就没有再去专门看相关的书籍,直到最近两年,感觉身边的东西又多了起来。于是,我又选了几本相关主题的书籍看了一下,提醒一下自己。
这本书的作者是日本的佐佐木典士,作者并非极简主义的发起者,而是一个践行者和布道者,极简主义的生活方式,不仅改变了他的物质生活,甚至改变了他的精神和生活状态,本书分享了作者的心得和体会。读这本书的时候,能感受到作者的温和、简素,也能让读者的内心趋于平静和舒适,推荐给大家。
这本书是一位陕西作家--路遥,写的发生在黄土高原上的城乡故事。时间跨度有10年之久,从文革末期的1975年,一直到改革开放初期的1985年。最早听到这本书,是初中时候一位好友的推荐,虽然后面一直没找到机会看,但却记下了书名。这本书的作者是陕西人,文字又比较朴实,基本都是平铺直叙式的大白话,虽然有厚厚的三本,但读起来依然是相当顺畅。尤其是书中夹杂着不少的陕西方言,例如:胡拧次、骚情等,让我这个陕西人读起来倍感亲切。全书的主线是孙少平、孙少安两兄弟,一个不甘心待在小山村、向往着外部的世界;一个则在家乡辛勤劳作、苦心经营自己的生活。在书中很多处,都对拼命劳作做出了诠释和褒扬,这也许是很多人评价此书“励志”的原因。用豆瓣上一位网友的话来说:像孙少平一样用心经营自己的精神世界,像孙少安一样脚踏实地,经营自己的物质生活。除了兄弟两人以外,还借助田福军这个人物的升迁调配,描绘了当时的时代背景下,政治生活的一些面貌,以及政策对城乡人民生活的影响和改变。
不能承受的生命之轻,这应该是米兰昆德拉最负盛名的一本书。知道作者,是很早前看过一篇基于他的书名《生活在他方》所写的短文。之后,在一个讲书的音频栏目中,听到了对本书的简单介绍。因为值得阅读的小说其实是有限的,而本书又声名在外,所以就买来读了(我觉着只要坚持阅读,那么在小说这个品类下,值得阅读的书,迟早是可以读完的)。
这本书主线讲了托马斯、萨比娜、特蕾莎三个人的感情纠葛,故事背景为上世纪的60、70年代的东欧国家捷克斯洛伐克,主要城市为布拉格,其间发生了颇具影响力的布拉格之春事件。这本书的写作手法是夹叙夹议的,就好像作者和你面对面坐在咖啡厅外的沙发上,向你侃侃而谈他所熟知的一桩轶事,其间不时地发表一些他个人的看法。书的时间线虽然总体上是顺序的,由远及近,但不时也会有倒序的地方,先交代了结果,再讲述这个发生这个结果之前发生了什么事情。
这本书是余华最负盛名的小说了。时间跨度从解放前直到文革后,这几十年间中国所发生的几乎一切苦难,都一一发生在了主人公福贵和他的家庭身上。面对着亲人一再离去这一连串的打击,在任何一个时刻,福贵都有足够的理由选择去死,然而他却依然选择了活下去。当小说结束时,活着的意志,是福贵身上唯一不能被剥夺走的东西。如同作者所说:人是为了活着本身而活着,而不是为了活着之外的任何事物而活。
然而,在这一点上,我却并不是很认同。在当前这个时代,活着对于大多数人来说,都已经不再是一个问题。个人觉得,我们活着,我们热爱生活,是因为我们有着爱我们的人,也有着我们所爱的人。为了他们的福祉,我们用心生活,努力让生活尽可能地轻松和愉快。
看这本书完全是被标题中的“若即若离”四个字吸引,想了解下什么样算是“若即若离”?本能上看到“若即若离”总是会想到恋爱中进退两难的男女关系,在普通的人际关系中保持这样的距离又有什么好处?本书比较特别的是,作者是在日式的禅庭设计中悟出的人际交往道理,所以结合了庭院设计中的“不均齐”、“简素”、“枯槁”、“自然”、“幽玄”、“脱俗”、“静寂”等要素。实际上和“若即若离”本身关系不大,只是强调人际交往的关键是合适的“距离感”,而“距离感”则取决于双方交往的深度以及双方观念的一致性。
知道李银河这个人,是因为读了王小波的《沉默的大多数》。李银河是王小波的热恋对象,同时,也是一个学者,主要的研究领域是社会学,尤其对家庭、婚恋、性方面的研究比较多。因为王小波活跃的时间是上世纪90年代,而李银河是他的妻子,所以总感觉他们是上个时代的人。起初,也担心这本书是否过于老旧,毕竟,李银河已是年近70的老人,她的爱情观是否能与时俱进?
这是近期读的赵永久的第2本书,前不久看过他的另一本书:《爱的五种能力》。《爱的五种能力》看过后感觉相当不错,在豆瓣上又刷到他的这本书,于是就又买了。看完后,感觉这两本书的内容并没有太多重合之处,但这一本写得并不比上一本好。起初,我以为这本书是讲如何在恋爱中推进关系的,实际上,这本书更多是针对“相亲市场”和“婚恋网站”的,目标读者,更多是想要迫切进入婚姻的大龄男女青年。关于如何更好地处理恋爱关系,那本《为何会拿好人卡》明显会更好一些。
如果你看过《如何阅读一本书》,就会知道有一种阅读方法叫做“主题阅读”,意思不是读一本书,而是针对某一个主题,阅读相关领域的好几本书。现在,我的一个阅读主题就是“两性关系”,以及如何“更好地去爱人”。所以,我在豆瓣上搜寻了相关主题的几本书,全都买来了,这是近期阅读的第2本。
这本书比我看的上一本《为何爱会伤人》,更好地贴合我选的主题。这本书的作者名气不及武志红,没有“北大心理学硕士”这样响亮的头衔。作者起初接触心理学,也完全是因为自己和爱人的关系不和,在进行了自我探索之后,开始系统学习心理学方面的知识。最后连职业都转为了心理咨询师,开设婚恋课程“爱的能力”解决人们的问题。而本书则是作者这门课程的精华内容集结。
最近在“得到”APP上听专栏:《武志红的心理学课》,觉得相当不错,既通俗易懂,又比较贴近生活。就在豆瓣上搜了下武志红,想看看他有什么著作。然后发现他写有十几本书,最早也最有名的一本,是《为何家会伤人》。这本书我很早就看见过,但没有读过,当时并不时很有兴趣。他的另一本《巨婴国》,在几年前出版后被禁售,引发了我的兴趣,还特意去找了电子书读了下,只是那时候没有留意作者是谁。
以前我不觉得爱是需要学习的,好像爱的能力每个人天生就有。最近我发现可能并不是这样的。所以我就想了解到底什么是爱,以及如何去爱,进一步讲,就是如何更好地处理两性关系,以及和他人、和自己内心的关系。所以,就买了这本《为何爱会伤人》。实际上,我不只买了这本书,而是买了一系列书,包括《爱的五种语言》、《爱的艺术》、《爱的五种能力》、《爱的沟通》、《幸福的婚姻》等五六本,待我读完再和大家分享。
这本书是一位朋友推荐我读的。然而,这本书读完后,却真的不知道他在说什么。道理似乎很简单,用四个字就可以概括了:活在当下。如果要再多说几句,就是关注当下手头在做的事情,体验自己此时此刻的身体状态、内心感受和情绪波动。不要想太多已经过去的事情,这些事情常常会让你感到懊恼和悔恨;也不要去想太多尚未发生的事情,未来的不确定性常常会让你感到焦虑和不安。这些道理虽然懂得,但试问如何能轻松做到?就好像《局外人》中的默尔索,在母亲下葬的第二天,就可以和情人去游泳、看喜剧电影,搞男女关系,完全没有悲伤的作态。
这是一本心灵修炼类的书,通篇都是 小我、本我、临在、开悟、意识、痛苦之身、未显化状态、臣服 这些玄而又玄的概念。至少第一遍读完后,我有一点云里雾里、不知所云的感觉。或许是一个“开悟”的作者,给一个仍未“开悟”的读者讲道,不过是自说自话而已。感觉要是能达到作者的状态,恐怕就是所谓的天人合一、物我两忘、立地成佛了吧。不过,在导读中,张德芬开篇就说这本书需要多读几遍才能领会,所以,可能我也没能很好地领悟吧。
这本书是加缪的代表作,薄薄的一本小书,不到200页,大约三四个小时就可以读完。加缪是“荒诞哲学”的代表人物,他的另外两本有名的作品是《鼠疫》和《西西弗神话》。这本书同样讲了一个有点荒诞的故事:主人公默尔索是一个公司的职员,对生活各方面都抱有“无所谓”的态度,一次无意的杀人让他上了法庭,最终被判斩首示众,但这一重刑却不完全是针对他杀人的罪行,而是针对他“在母亲葬礼上没有哭”这一行为。默尔索本来也有机会按照律师的建议进行辩解,然而他始终是怎么想的就怎么说,拒绝掩饰自己的感觉。总有人想让他承认,让他为自己的罪行悔恨。他的回应却是,与其说感到悔恨,不如说是觉得厌烦。
用加缪自己的话来说:《局外人》讲述的是一个毫无英雄主义的自命不凡、只是愿意为真实付死的男人的故事。
这又是一本“得到”图书,作者香帅先是在得到APP上面开设了金融方面的课程,然后又出了书。之前我已经读过她的另一本书《钱从哪里来:中国家庭的财富方案》。在一次逛西西弗书店的时候,看到作者又新出了这本,就买来读一读。这本书有点类似何帆的《变量》,变量的作者打算花30年的时间,每年出一本书,记录中国的发展进程。香帅也在进行一个类似的计划,同样每年出一本,不过时间跨度是20年,主题是关于财富,这本是第2本。第1本应当就是那本《钱从哪里来》吧。
这本书的主题是分化时代的财富选择。总体来说,作者并没有带来太多新的观点,很多内容都是已经发生并且大家都熟悉的,例如中国家庭的主要财富是房产,而房产所在的城市和区域,则是人群财富分化的首要原因。
这是我看的东野圭吾的第4本小说,是他评价最高的一本,也是他的代表作。之前看过的另外三部口碑最好的是:《嫌疑人x的献身》、《恶意》、《解忧杂货铺》。这样,东野圭吾最好的四本书我都读完了,短期内应该不再读这个作者的书了吧。有时候我在想,虽然每个作者可能都会写好多书,比如毛姆、加缪、三毛、余华等等,但是每个作者选他最好的一本读,这样就可以最小的时间成本和代价,阅读最广泛和最优秀的作品了吧。
《白夜行》故事的时间跨度有19年,从一桩离奇的谋杀案开始,一直到谜团基本解开、男主死亡为止。这本书的节奏把控的很好,一共13个章节,每个章节描写了时间线上的一个片段,以一个人物的视角交代了一个小故事,又与随后的故事紧密联系。这本书有600页厚,读起来却是丝丝入扣,一点也不枯燥,我是花了一天半的时间,几乎一口气读完的。