刷新
读商战数据挖掘:你需要了解的数据科学与分析思维07相似性

博主头像 1. 概述 1.1. 相似性是许多数据科学方法和商业问题解决方案的基础 1.1.1. 共通之处 1.1.2. 很多数据挖掘过程通常基于相似性或寻找“合适”的相似性来对个体进行分组 1.1.3. 分类模型生成分类边界来将目标变量值相同的个体归为同一组 1.2. 相似性可以用于分类和回归 1.3. 亚马 ...

MySQL 04 深入浅出索引(上)

博主头像 索引的常见模型 实现索引的方式有很多种,这里先介绍三种常见结构:哈希表、有序数组和搜索树。 哈希表:只适用于只有等值查询的场景。 有序数组:在等值查询和范围查询场景中的性能都非常优秀,但是在更新数据的时候需要挪动大量记录。因此,只适用于静态存储引擎。 二叉搜索树:树层数可能很高,可能一个节点上的数据 ...

MySQL 03 事务隔离:为什么你改了我还看不见?

博主头像 事务就是要保证一组数据库操作,要么全部成功,要么全部失败。在MySQL中,事务支持是在引擎层实现的,这也是InnoDB取代MyISAM的重要原因之一。 隔离性与隔离级别 事务的四大特性:原子性、一致性、隔离性、持久性。本文主要讨论隔离性。 当数据库上有多个事务同时执行的时候,可能出现脏读、不可重复读 ...

16. MySQL 多版本并发控制

博主头像 16. MySQL 多版本并发控制 @目录16. MySQL 多版本并发控制1. 什么是MVCC2. 快照读与当前读2.1 快照读2.2 当前读3. 复习3.1 再谈隔离级别3.2 隐藏字段、Undo Log版本链4. MVCC实现原理之ReadView4.1 什么是ReadView4.2 设计思路 ...

读商战数据挖掘:你需要了解的数据科学与分析思维06过拟合

博主头像 1. 概述 1.1. 数据科学中最重要的基本概念之二就是过拟合和泛化能力 1.2. 数据挖掘包含模型复杂度和过拟合概率之间的基本权衡 1.3. 如果数据所表现的现象本身就很复杂,那么就有必要构建一个复杂的模型,但复杂的模型对训练数据过拟合的风险也较高 2. 过拟合 2.1. “模式”事实上只是偶然出 ...

(二) 初次使用MySQL

博主头像 摘要 本文会围绕mysql会话来详细地介绍会话的获取、使用和终止的整个过程,主要包括: 登入mysql会话:通过mysql调用命令和身份凭证获取会话资格。 使用mysql会话:比如编写SQL语句、执行SQL语句和取消已执行的SQL语句。 登出mysql会话 此外,在文章的最后,还提供了快速调用mys ...

GreatSQL通过伪装从库回放Binlog文件

博主头像 GreatSQL通过伪装从库回放Binlog文件 一、适用场景说明 1、主库误操作恢复 利用 Binlog 在其他实例解析、回放,根据gtid只回放到指定位点。 2、网络隔离环境同步 备份恢复后可以拉去主库Binlog文件至新实例同步增量数据。 3、备份恢复遇到Binlog文件过大处理 恢复实例时有 ...

12 MySQL 数据库其它调优策略

博主头像 12 MySQL 数据库其它调优策略 @目录12 MySQL 数据库其它调优策略1. 数据库调优的措施1.1 调优的目标1.2 如何定位调优问题1.3 调优的维度和步骤第1步:选择适合的 DBMS第2步:优化表设计第3步:优化逻辑查询第4步:优化物理查询第5步:使用 Redis 或 Memcache ...

读商战数据挖掘:你需要了解的数据科学与分析思维05拟合数据

博主头像 1. 拟合数据 1.1. 预测建模就是根据其他描述性属性找出目标变量的模型的过程 1.2. 从数据集中提取预测模型的方法,是先确定模型的结构,而使模型的数值型参数待定 1.2.1. 然后再通过数据挖掘,根据特定的训练数据集计算出最佳参数值 1.3. 常见的情形是,模型由含有一系列数值变量的参数化的数 ...

MySQL 01 基础架构:一条SQL查询语句是如何执行的?

博主头像 比如执行一条查询语句: select * from T where ID=10; 首先给出MySQL的基本架构示意图,从中也可以看到执行过程: 基本结构分为两部分: Server层。里面包含连接器、查询缓存、分析器、优化器、执行器等,涵盖MySQL大多数核心服务功能,以及所有内置函数。 存储引擎层。 ...

11-3 MySQL 中对于 PowerDesigner 的使用

博主头像 11-3 MySQL 中对于 PowerDesigner 的使用 @目录11-3 MySQL 中对于 PowerDesigner 的使用1. PowerDesigner的使用1.1 开始界面1.2 概念数据模型1.3 物理数据模型1.4 概念模型转为物理模型1.5 物理模型转为概念模型1.6 物理模 ...

为什么PostgreSQL不自动缓存执行计划?这可能是最硬核的优化解读

博主头像 为什么PostgreSQL不自动缓存执行计划?这可能是最硬核的优化解读 前言 在数据库性能方面,查询语句的执行计划是最关键的因素之一。每当数据库接收到一个查询时,它必须决定如何以最有效的方式执行该查询。这个决策过程——称为执行计划。 计算并生成最优的执行计划在时间上可能非常昂贵,尤其是对于经常执行的 ...

【7 月 5 日北京】圆桌讨论重磅嘉宾首曝,这场还有 3 天的技术盛宴藏不住了!

博主头像 3️⃣距离我们的大会在北京民航国际会议中心(朝阳区花家地东路 3 号)与大家见面还有 3 天! 以「下一站:DB + AI」为主题,超 30 位行业领袖、技术大咖与学术专家将齐聚一堂,在主论坛 + 3 大分论坛中分享前沿成果,碰撞思维火花! 顶级专家领衔深度对话! ✨ 主论坛圆桌讨论《AI 时代 ...

DolphinScheduler 6 个高频 SQL 操作技巧

博主头像 摘要: Apache DolphinScheduler系列4-后台SQL经验分享 关键词: 大数据、数据质量、数据调度 整体说明 在调研了 DolphinScheduler 之后,在项目上实际使用了一段时间,有了一些后台SQL实际经验,分享如下。 进入DolphinScheduler 后台数据库,我 ...

<1···789···50>