JS前端千万级弹幕数据循环优化示例

2024-05-01 01:02:05

引言

最近做了直播相关的业务，然后对于大数据相关的优化做了一下复盘。

为了了解我是怎么做这个优化的，我们先从如何按照特定的条件删除一个数组说起。

1、如何删除数组中的元素

场景：有一个数组，需要删除满足条件的数组。

示例：

const arr = [1,2,3,4,5,6,7,8]

删除小于5的元素,删除后的元素为

const arr2 = [5, 6, 7, 8]

代码实现：

const arr = [1,2,3,4,5,6,7,8]
for(let i = 0, len = arr.length; i < len; i++) {
	if(arr[i] < 5) {
		arr.splice(i, 1)
	}
}

结果如下

arr = [2, 4, 5, 6, 7, 8

不是我们预期的结果

分析原因：删除操作会使得对应索引值位上的元素清空，整个数组中的元素向前移动一位，补位的元素会填充到执行删除操作的索引值位置上，移位之后如果不进行任何操作继续下一个循环，会导致补位元素跳过遍历，为了防止这种补位元素跳过遍历现象，应该在删除操作后将索引值减1，对执行删除操作的索引值位置再进行一次遍历。

改进：

const arr = [1,2,3,4,5,6,7,8]
for(let i = 0, len = arr.length; i < len; i++) {
	if(arr[i] < 5) {
		arr.splice(i, 1)
    i--;
	}
}
// arr = [5, 6, 7, 8] 符合预期

这个是做了正序循环删除，也可以使用倒序循环删除：

const arr = [1,2,3,4,5,6,7,8]
for(let i = arr.length - 1; i >= 0; i--) {
	if(arr[i] < 5) {
		arr.splice(i, 1)
	}
}
// arr = [5, 6, 7, 8] 符合预期

2、10000,000条消息如何优化？

场景

弹幕消息发送场景模拟（伪直播形式，没有进度条）：假设我们有10000,000条消息，根据视频播放的进度展示对应的消息，不展示历史消息。

常规思路：

循环遍历整个消息列表，时刻监听视频播放的进度，根据视频播放的时间戳和消息发送的时间戳先相等，然后展示消息，依次循环。

产生的问题

每次视频进度变化都会循环整个消息列表，当循环还没完成，下一个播放进度监听触发了，又开始下一个循环，这样就会造成性能的损耗。

优化策略

我们从上面的分析可以看出，当消息发送了一条，就可以从原始数据删除这条消息，然后跳出循环，这样循环的次数始终控制在几次（或者几十次）的范围（有可能同一个时间段同时有几条消息甚至几十条消息）等下一个播放进度监听触发，开始循环原始数据，这是之前以后发送过得数据删除了，就不会再循环删除过的数据，始终循环需要发送的那几条，找到了就直接跳出循环。

代码实现

// 模拟原始消息列表，
const newList = new Array(10000000).fill(1).map((item, index) => {
  return {
    time: (index + 1) * 1000,       // 消息发送的时间，一秒一个
    content: `这是第${index + 1}s发送的消息` // 消息发送的内容
  }
})
// 发送的消息列表
const sendList = [];
function getMessage(time) {
  let j = 0; // 循环次数
  for(let i = 0, len = newList.length; i < len; i++) {
    const item = newList[i];
    j++;
    // 这里的time如果不是1000、2000，而是1234、1214这种，就需要取一个浮动范围
    // 我这里就是简单用了定时器，所以比较简单
    if(item.time === time) {
      sendList.push(newList[i])
      newList.splice(i, 1)
      i--;
    } else if(sendList.length > 0) {
        break;
    }
  }
  console.log('播放进度', time)
  console.log('循环的次数', j);
  console.log('接收的消息的长度', sendList.length, sendList);
  console.log('原始消息的长度', newList.length);
}
let time = 0;
// 定时器,1s触发一次
setInterval(() => {
  time += 1000;
  getMessage(time);
}, 1000)

// 消息格式
newList = [
  {time: 1000, content: '这是第1s发送的消息'},
  {time: 2000, content: '这是第2s发送的消息'},
  ...
]

效果展示

小结

上面优化策略只有两条

发送过的消息删除，下次少循环。

当找到满足条件的数据，直接跳出循环，后面的数据不再循环。

缺点：使用slice也会消耗性能，不可取，并且操作繁琐。

游标法代替splice

我们这里不再使用slice的方案，设置一个游标，记录循环的初始位置，下次循环直接从游标记录的位置开始循环，然后满足查找的条件就break，这样既不破坏原来的数组，也能有效的减少循环的次数。

  let index = 0， sendList =[];
  function getMessage(time) {
    for(let i = 0, len = newList.length; i < len; i++) {
        const item = newList[i];
        // 这里的time如果不是1000、2000，而是1234、1214这种，就需要取一个浮动范围
        // 我这里就是简单用了定时器，所以比较简单
        if(item.time === time) {
          index = i;
          sendList.push(newList[i])
        } else if(sendList.length > 0) {
            // 这里的查询结束条件为，对应的时间范围之外没有消息了，并且需要发送的消息列表有消息，才break
        // 这里的结束条件想不到什么更好的方案了
        break;
    }
  }
}

上面我们只对视频播放的时候做了优化，如果下次用户进来进度直接接近尾声了，这时候首次查找尾部消息的时候，就需要把前面所有的消息都循环一遍，所以还需要继续优化。

二分查找

当首次加载的时候，采用二分法查找到消息开始的位置，当视频播放的时候再根据查找到的index去循环消息体。

function binarySearch(arr, time) {
    let upperBound = arr.length - 1; // 记录长度
    let lowerBound = 0; // 记录上次二分的位置
    let mid;
    // 切半分的位置 小于或等于 1就停止循环了
    while (lowerBound <= upperBound) {
      // (当前总长度 + 当前中间点位置长度) / 2 = 实际的中间点位置
      mid = Math.floor((upperBound + lowerBound) / 2);
      const item = arr[mid];
      const maxTime = time +　500;
      const minTime = time + 500;
      // 当输入的值大于中间值时，向后移动一位
      if (time > maxTime) {
        lowerBound = mid + 1;
      } else if (time < minTime) {
        // 当输入值小于中间值时，向前移动一位
        upperBound = mid - 1;
      } else {
        return mid; // 找到指定数据位置
      }
    }
    return -1;
  }

function findIndex(startPlayTime: number) {
    const searchIndex = binarySearch(this.messageList, time);
    // 赋值索引，用于快速发送消息
    if (searchIndex !== -1) {
      index = searchIndex;
    }
  }

完结

写到这里本篇文章就不再会更新了，从最开始的splice方法，然后到后面的游标法和二分法，做了逐渐的优化。

这个也是在项目中每次迭代去做的优化（前提是给你的排期你能有时间去做）。本文涉及的知识点可能并不是很重要，在这里我要跟大家说的是，我们平时在写代码的时候，要善于发现代码的可优化空间，如果你发现了并且实事求是的去做了，你的能力就会有更大的提高，而且这个发现的过程你可以找同事，找leader去给你review代码，在业务中沉淀出来的代码比你自己平时写个小demo写的代码更能让你成长。

更多关于JS前端数据循环优化的资料请关注我们其它相关文章！

Javascript中JSON数据分组优化实践及JS操作JSON总结

现有一堆数据,我需要按时间进行分组,以便前端视图呈现 [ {"date":"2017-12-22","start_time":"10:00:00","end_time":"10:00:00","status":"Performance Time"}, {"date":"2017-12-22","st
如何在JavaScript中优雅的提取循环内数据详解

前言在本文中,我们将介绍两种提取循环内数据的方法:内部迭代和外部迭代.分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧循环举个例子,假设有一个函数 logFiles(): const fs = require('fs'); const path = require('path'); function logFiles(dir) { for (const fileName of fs.readdirSync(dir)) { // (A) const filePath = pat
JavaScript数据结构之优先队列与循环队列实例详解

本文实例讲述了JavaScript数据结构之优先队列与循环队列.分享给大家供大家参考,具体如下: 优先队列实现一个优先队列:设置优先级,然后在正确的位置添加元素. 我们这里实现的是最小优先队列,优先级的值小(优先级高)的元素被放置在队列前面. //创建一个类来表示优先队列 function Priorityqueue(){ var items=[];//保存队列里的元素 function QueueEle(e,p){//元素节点,有两个属性 this.element=e;//值 this.pr
JS循环遍历JSON数据的方法

JSON数据如:{"options":"[{/"text/":/"王家湾/",/"value/":/"9/"},{/"text/":/"李家湾/",/"valu e/":/"10/"},{/"text/":/"邵家湾/",/"value/":/"13
js实现省级联动（数据结构优化）

本文实例为大家分享了js实现省级联动的具体代码,供大家参考,具体内容如下 <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> <title>D
JavaScript数据结构之单链表和循环链表

数据结构系列前言: 数据结构作为程序员的基本知识,需要我们每个人牢牢掌握.近期我也展开了对数据结构的二次学习,来弥补当年挖的坑...... 当时上课的时候也就是跟着听课,没有亲自实现任何一种数据结构,更别提利用数据结构来解决问题了. 现在就来填坑了奋斗在这里提醒看到我博客的孩子们,如果你还是在校生,永远不要轻视任何一门基础课的学习,这个时候挖的坑,要么需要用双倍的努力去填,要么会直接影响一个人的能力等等...... 千万别给自己挖坑进入正题,关于链表的数据结构知识,这里简单介绍下:
高性能Javascript笔记数据的存储与访问性能优化

局部变量也就可以理解为在函数内部定义的变量,很明显访问局部变量要比域外的变量要快,因为它位于作用域链的第一个变量对象中(关于作用域链的介绍可以阅读这篇文章).变量在作用域链的位置越深,访问所需要的时间就越长,全局变量总是最慢的,因为它们位于作用域链的最后一个变量对象. 每种数据类型的访问都需要付出点性能代价,对于直接量和局部变量基本都能消费得起,而访问数组项和对象成员则要代价高点.下图显示了不同浏览器,分别对这四种数据类型进行了200'000次操作所用的时间. 由上图可以看出,要想优化代码的性能
JS前端千万级弹幕数据循环优化示例

目录引言 1.如何删除数组中的元素 2.10000,000条消息如何优化? 场景常规思路: 产生的问题优化策略代码实现效果展示小结游标法代替splice 二分查找完结引言最近做了直播相关的业务,然后对于大数据相关的优化做了一下复盘. 为了了解我是怎么做这个优化的,我们先从如何按照特定的条件删除一个数组说起. 1.如何删除数组中的元素场景:有一个数组,需要删除满足条件的数组. 示例: const arr = [1,2,3,4,5,6,7,8] 删除小于5的元素,删除后的元素为
MySql 快速插入千万级大数据的方法示例

在数据分析领域,数据库是我们的好帮手.不仅可以接受我们的查询时间,还可以在这基础上做进一步分析.所以,我们必然要在数据库插入数据.在实际应用中,我们经常遇到千万级,甚至更大的数据量.如果没有一个快速的插入方法,则会事倍功半,花费大量的时间. 在参加阿里的天池大数据算法竞赛中(流行音乐趋势预测),我遇到了这样的问题,在没有优化数据库查询及插入之前,我花了不少冤枉时间,没有优化之前,1500万条数据,光插入操作就花费了不可思议的12个小时以上(使用最基本的逐条插入).这也促使我思考怎样优化数据库插入
Python批量删除mysql中千万级大量数据的脚本分享

场景描述线上mysql数据库里面有张表保存有每天的统计结果,每天有1千多万条,这是我们意想不到的,统计结果咋有这么多.运维找过来,磁盘占了200G,最后问了运营,可以只保留最近3天的,前面的数据,只能删了.删,怎么删? 因为这是线上数据库,里面存放有很多其它数据表,如果直接删除这张表的数据,肯定不行,可能会对其它表有影响.尝试每次只删除一天的数据,还是卡顿的厉害,没办法,写个Python脚本批量删除吧. 具体思路是: 每次只删除一天的数据: 删除一天的数据,每次删除50000条: 一天的数据删
JS前端中的设计模式和使用场景示例详解

目录引言策略模式 1.绩效考核 2.表单验证策略模式的优缺点: 代理模式 1.图片懒加载: 2.缓存代理总结引言相信大家在日常学习和工作中都多多少少听说/了解/使用过设计模式,我们都知道,使用恰当的设计模式可以优化我们的代码,那你是否知道对于前端开发哪些设计模式是日常工作经常用到或者必须掌握的呢?本文我将带大家一起学习下前端常见的设计模式以及它们的使用场景!!! 本文主讲: 策略模式代理模式适合人群: 前端人员设计模式小白/想知道如何在项目中使用设计模式策略模式策略
JS前端二维数组生成树形结构示例详解

目录问题描述实现步骤完整代码问题描述前端在构建国家的省市区结构时,接口返回的不是树形结构,这个时候就需要我们进行转化.以下数据为例 [ [ { "districtId": 1586533852834, "parentCode": "000", "nodeCode": "000001", "name": "浙江省", "districtType&qu
RSA实现JS前端加密与PHP后端解密功能示例

本文实例讲述了RSA实现JS前端加密与PHP后端解密功能.分享给大家供大家参考,具体如下: web前端,用户注册与登录,不能直接以明文形式提交用户密码,容易被截获,这时就引入RSA. 前端加密需引入4个JS扩展文件,jsbn.js.prng4.js.rng.js和rsa.js. <html> <head> <title>RSA Login Test</title> <meta charset="utf-8"> <scr
js 与 php 通过json数据进行通讯示例

js 与 php 通过json数据进行通讯例子: php文件复制代码代码如下: <?php echo json_encode(array(array( 'liaotiantiao'=>$liaotiantiao, 'liaotiank'=>$liaotiank, 'chatuserid'=>$chatuserid, 'chattouserid'=>$chattouserid ))); ?> html 文件复制代码代码如下: $(document).ready(
javascript前端和后台进行数据交互方法示例

在开发中遇到了在没有jQuery的情况下需要与后台进行部分数据的交互,查找了部分资料使用JavaScript实现了操作,记录一下. //获取XMLHttpRequest对象用于与后台交互数据 function getXHR(){ var xmlHttp; try { xmlHttp=new XMLHttpRequest();//新版本浏览器 }catch(e) { try{ xmlHttp=new ActiveXObject("Msxml2.XMLHTTP"); } catch(e)
30个mysql千万级大数据SQL查询优化技巧详解

1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引. 2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描,如:select id from t where num is null可以在num上设置默认值0,确保表中num列没有null值,然后这样查询:select id from t where num=0 3.应尽量避免在 where 子句中使用!=或<>操作符,否则引擎将放弃使用
MySQL千万级大数据SQL查询优化知识点总结

1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引. 2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描,如:select id from t where num is null 可以在 num 上设置默认值 0,确保表中 num 列没有 null 值,然后这样查询:select id from t where num=0 3.应尽量避免在 where 子句中使用!=或<>操作符,否