ModelWhale

个人数据分析工具,组织数据科学协同平台

先进工具,助力数据科学工作者快速调优丨和鲸科技 × Weights & Biases

#和鲸动态 #和鲸科赛 #和鲸社区

12月14日,和鲸科技与数据科学平台厂商 Weights & Biases 联合举办的目标识别类 Workshop 公益活动正式告一段落,这也标志着两家数据科学领域的杰出企业即将开启新的合作征程。和鲸科技 × Weights & Biases携手助力数据科学工作者,应用先进工具提升模型调优效率人工智能、机器学习技术的发展与成熟,催生了国内外各类工具呈爆发式增长,其中不乏许多优秀的生产力工具脱颖而出。本次与和鲸合作的 Weights & Biases(下简称“W&B”),就是美国先进机器学习开发工具独角兽公司。…

Jing

和鲸科技入选 2022 中国数据智能领域最具商业潜力的科技 Cool Vender丨甲子20 榜单

#和鲸动态 #ModelWhale

12月7日,由中国领先的科技产业智库甲子光年举办的 2022「甲子引力」年终盛典大会首日于线上成功举办。「心有所护,不畏远行」,大会于现场的「高光 · 突围」红毯颁奖礼揭晓了「甲子20」年度榜单,以表彰2022年度在科技产业各赛道上拥有核心技术实力,并在商业化上颇有成效的优秀成长型科技公司。和鲸科技携旗下数据科学协同平台 ModelWhale ,凭借多年深耕数据智能领域所积累的出众能力与实践经验,强势入选「2022中国数据智能领域最具商业潜力的科技企业Top20」。本次榜单评选根据企业提供的多维度信息和数据,采用科学完备的数据处理分析方法进行综合评判后发布,和鲸的脱颖而出代表了行业专业机构对公司产品和服务能力的极大认可。2022中国数据智能领域最具商业潜力的科技Cool Vender随着数据智能成为企业实现数字化转型的核心方式,企业智能化应用场景正变得更加普遍。…

Jing

解读国家自然科学基金“十四五”发展规划优先发展领域中大数据驱动的研究创新平台建设

#ModelWhale

近日,《国家自然科学基金“十四五”发展规划》正式发布规划全文。“发展规划”共计21个章节,详细地阐明了国家自然科学基金委于“十四五”期间的发展方向与相关理念,并公布了完整的115项优先发展领域,意义重大。“发展规划”115项优先发展领域中囊括了丰富的学科门类,而引起我们注意的是多个“大数据”与“传统学科”的交叉融合:例如,“大数据与人工智能在化学、化工中的应用”(大数据+化学)、“地球与行星观测的新理论、新技术和新方法”…

Jing

和鲸 ModelWhale 入选《2022爱分析 · 数据智能厂商全景报告》数据科学与机器学习平台推荐厂商

#ModelWhale #和鲸动态

近日,中国知名数字化市场研究咨询机构爱分析,正式发布了《2022爱分析 · 数据智能厂商全景报告》,通过综合考虑企业关注度、行业落地进展等多项因素,对13类数据智能特定市场进行重点研究,并结合评价模型遴选能为企业提供数据智能产品和服务的优质厂商。和鲸科技携旗下数据科学协同云平台 ModelWhale ,凭借多年深耕数据智能领域所积累的出众能力与实践经验,作为 “数据科学与机器学习平台” 推荐厂商强势入选。随着数据智能成为企业实现数字化转型的核心方式,企业智能化应用场景正变得更加普遍,由此带来企业建模需求激增。传统的机器学习模型主要依靠专业数据科学家进行开发,存在开发流程慢、模型反复开发不共用的情形。企业想要把数据分析扩展至更多应用场景,以在业务发展与运营中实现降本增效,或构建创新性的业务模式,必须内外打通多业态、多部门、…

Jing

数据驱动科研,清华大学中国新型城镇化研究院使用 ModelWhale 云端协同创新平台

#ModelWhale

新基建的浪潮如火如荼,国家顶层政策的引导不仅支持着由数据驱动各垂直领域中的新兴商业市场,也为相关科研市场的发展提供了众多机遇。但持续的发展也带来了新的问题,传统基础设施已逐渐不能响应新兴数据驱动研究所需的软硬件支持。本文将从此类问题出发,为各领域研究团队介绍 ModelWhale 云端数据科学协同平台,以其不同的产品服务价值在不同层面上提供系列解决方案,期待为由数据驱动的科学研究提供助力。目录数据驱动研究部署于传统基础设施的现存问题ModelWhale,数据驱动研究的云端协同创新平台数据驱动研究的全生命周期管理数据资产与研究成果的沉淀与展示强大的算力调度管理能力客户案例分享 · 清华大学中国新型城镇化研究院:交叉领域科研云端数据分析协同创新平台结束语数据驱动研究部署于传统基础设施的现存问题部署于传统基础设施的数据驱动研究在大环境发展中所暴露出的问题,归根结底是此类基础设施已无法满足现有的使用需求。在对相关高校与科研机构的痛点问题进行客户调研后,本文得出以下结论。科研期待:项目能有完整的生命周期,结项不是项目的终结,后续能够复用是项目生命的存续实际情况:极不合理的项目成果管理方式为“成果复用”设置重重阻碍对既往研究成果进行复用以赋予项目完整生命周期中的“复用”…

Jing

从清华大学到苏州经贸,双一流和普通高校都在使用的数据科学教学实训平台

#ModelWhale

新基建的浪潮掀起了新一轮“大数据+”人才需求,很多高校都陆续开设了数据科学、人工智能类专业和课程。和鲸总结了高校培养数据人才过程中的重难点,再基于 ModelWhale 建设了聚焦教学场景的云端数据科学教学实训平台以提供全面解决方案,最后分享暨南大学经管中心的真实教学实践作为案例参考。目录“大数据+”人才培养的重难点赛训一体的云端数据科学教学实训平台低门槛、易上手的数据分析建模教学实践环境赛训一体化的人才培养方案算力弹性调度管理 · 免运维暨南大学 · 经管中心大数据教学实训平台结束语“大数据+”人才培养的重难点近几年来,很多高校都陆续开设了数据科学、人工智能类专业和课程,相较于传统教学,“大数据+”人才所需要的培养环境更加复杂,存在着许多特质化的重难点。为此,我们调研了清华、…

Jing

中国自然资源航空物探遥感中心如何将 ModelWhale 应用于科研与业务丨遥感 + AI

#ModelWhale

伴随着“新基建”的浪潮推动科研数智化发展,深度学习等人工智能技术的引入成为了近年来研究者密切关注的热点。高质量的遥感影像在灾害监测、气象、军事等诸多方面都有广阔的应用前景,AI 技术在图像匹配方面有着比较好的特征提取和表达能力,便于从海量异构的遥感数据中获取丰富准确的属性信息,挖掘目标区域的演变规律。然而,AI 技术的深入应用在协助研究者解决更加复杂的场景问题的同时,也给传统基础设施与工作流带来了挑战,在此简单介绍以下三个方面。1. 基础设施与计算资源遥感图像分辨率的提升、网络深度的增加毋庸置疑会带来性能的提升,但与之相伴的是庞大的模型、巨量的参数和缓慢的算法效率,本地台式机的运算能力很难满足日益上升的需求,需要投入大量的硬件成本。同时,算法模型在训练时需要频繁地调试参数,并将不同结果进行可视化以提高调优效率,…

Jing

生物统计师与临床医生协同研究使用的低代码洞察平台丨数据科学 x 临床医学

#ModelWhale #和鲸动态

临床研究的“多角色”特性临床研究是以疾病的诊断、治疗、预后和病因为主要研究内容,以患者为主要研究对象的科学研究活动。现代临床研究项目的开展具有“多角色”参与的特性,除了发起项目的 PI 外,项目的核心团队可能还包含多个临床医生、CRC、CRA、生物统计师等等。随着真实世界研究受到广泛关注,成为了临床证据挖掘、转化使用的新方法,人工智能等新技术在研究流程中的介入也不断深化,临床研究的多中心交叉协同特性愈加显现。在一项真实世界研究的完整路径中,无论是前期数据收集的规范控制,还是核心的数据治理过程,以及统计分析过程,都需要临床医生与专业的临床科研专家、…

Jing

交大医学院临床研究中心如何将 ModelWhale 应用于临床医生教学、研究丨数据科学 x 临床医学

#ModelWhale #和鲸动态

数据科学 x 临床医学真实世界数据(real world data,RWD)近几年成为了临床医生、生物统计师以及药企日益关注的对象,指来自现实医疗环境的、传统临床试验以外的数据。真实世界数据可以反映实际诊疗中患者的健康状况和医疗服务过程,与传统临床试验收集的数据相比,RWD 样本量通常较大,涵盖了海量临床信息,且更加杂乱无章,存在未标化、异构化等特点。面对种类繁多、高维复杂的临床数据,为了提升资源利用率、实现分析的便携度,云计算、机器学习等前沿信息技术逐渐与医学研究深度融合。在临床医学中,…

Jing

ModelWhale 云端运行 WRF 中尺度数值气象模式,随时随地即开即用的一体化工作流

#ModelWhale

WRF(Weather Research and Forecasting Model)是由美国环境预测中心(NCEP)及美国国家大气研究中心(NCAR)等一系列美国科研机构合作开发的一款中尺度数值天气预报模式,因具有可移植、可扩充、易维护及高效率等优势,使其在国内外都得到了广泛的应用。但由于本地 WRF 模式的运行需要基于 Linux 系统,全流程上的编译、安装、前处理、运行及分析过程都具备相当程度的复杂性,因此给相关研究人员带来了不少实操上的困难。基于此,…

Jing

破解数字化转型困局,企业分析协同场景案例解析

#ModelWhale

随着互联网技术和数字化生存带来的众多商业模式创新,企业不断加速数字化转型,挖掘数据价值、指导业务决策,而高效流畅的协同能力却成为了企业组织管理和数据驱动的瓶颈。典型场景有如企业数字化团队人员各自为战工作流程难以协调统一、生产资料及最终产成品缺乏管理致使软性资产易流失、业务人员工程能力较弱无法真正参与数据驱动的业务场景、外部人员协助项目而企业内资产安全性得不到保障等等……因此,针对于大数据协同管理难点的产品级解决方案是当前帮助企业走出协同瓶颈,集约化生产管理,释放数据价值,多维度赋能业务的必然选择。大数据下企业的协同管理可分为三个层级:1. 数字化团队内部协同:指企业的数字化部门在进行数据分析建模的过程中,对于数据流程、生产要素、资料成果的协作、共享及管理2. 大数据项目跨部门协同:指企业在数据驱动业务模式下,数字化部门与业务部门在模型构建、业务应用、…

Jing

可复现、开放科研、跨学科合作:数据驱动下的科研趋势及应用方案

#ModelWhale

信息技术的快速发展,催化了数据科学场景下科研组织提高科学研究的可复现性、实现开放科研、开展跨学科领域的交叉研究等协同诉求。本文剖析了此三类诉求的实现难点,并提供了系统化的解决方案。数据驱动下的科研诉求现如今,越来越多的研究者用量化的方法解决科研问题,不仅会对广泛的数据作实时、动态地监测与分析,更把数据作为新的对象和基础来思考、设计和开展科学研究。这给科学界带来了更严谨、更有创造力的科研成果,极大地提升了科研效率,但同时也对数据驱动的研究范式与工具提出了更多的要求和挑战,我们将其归结于科研团队的三方面诉求。1. 科学研究的可复现性可复现性指的是在相似条件下,在重复测量、实验、计算等研究过程中可以得到相对稳定的数据结果。“可复现”通常被视为一项有意义的科研成果的重要标准。相较于基于文本的传统学术信息交流,数据驱动研究中的文献与数据紧密相连,…

Jing