数据结构之位图【原理与实现】-程序员宅基地

技术标签: c++  数据结构  


前言

bitmap意为位图,它的每一位用于存放状态,适用于大规模并且不重复的数据,判断某个数据是否存在于位图之中。bitmap在数据稠密的时候,非常节省空间,但是在数据稀疏的时候,会有极大的浪费

一、位图bitap是什么?

个int类型占4个字节,也就是32bit,我们用一个int数组来表示时 new int[32],总计占用内存大概32*32bit,如果说我们存放的海量数据,亿万级非常大,那么这些基本数据类型都不够用的,则可以用int字节码的每一位表示一个数字,比如int类型32位,可以存放0-31共32个数值,那么32个数字只需要一个int类型所占内存空间大小就够了,这样在大数据量的情况下会节省很多内存。

就是通过定义一个整形数值后,将原本只表示1个数值的情况下,扩大了可以存放几十个数及以上的结构,比如我们要存放0-63的数,共64个数,那么我们就定义一个long型变量,有8个字节,64位,二进制就是64位,那么每一位从左到右就可以表示0,1,2…,63,如果有数则可以赋值1 没有则表示0 比如保存1,那么就是第二位赋值1 ,以此类推
下面我们演示下,传递一个数值,保存到一个long[] arr数组中,简单了解下:
arr[0]存放的值: 0 - 63
arr[1]存放的值: 64 - 127
arr[2]存放的值: 128 - 191
举例num =4 存放的位置就是 arr[0] 第一个元素 因为 num /64 = 0 ,元素二进制 00…10000 第五位赋值1
在这里插入图片描述

二、位图的引用场景

所以位图bitmap的作用是:
存放海量数据,节省存储空间有明显优势在这里插入代码片

1、查询统计、定位查询,排序,去重

**查询统计:**假设有一个包含1000万个整数的数据集,我们想要知道其中有多少个整数大于等于100。我们可以使用一个位图,位图的长度为100000000(即整数范围),每个位置代表一个整数,如果对应位置的位为1,则表示该整数存在;否则,表示不存在。对于大于等于100的整数,将对应的位置设置为1,其他位置默认为0。最后,通过统计位图中值为1的位的数量,就可以得到大于等于100的整数的数量。

**定位查询:**假设有一个存储用户标签信息的位图,其中每个位置代表一个标签,如果对应位置的位为1,则表示该用户拥有该标签;否则,表示不拥有。当需要查找拥有指定标签的用户时,只需要检查位图中对应位置的位是否为1即可快速定位到拥有该标签的用户。

**去重:**假设有一个包含大量重复元素的数据集,我们需要对这些元素进行去重操作。我们可以使用一个位图,将数据集中的每个元素映射到位图的对应位置,如果对应位置的位为0,则表示该元素不存在;否则,表示已经存在。当遍历数据集时,可以根据位图来判断某个元素是否已经存在,从而实现去重操作。

2、取两个集合的交集,并集等

取两个集合的交集:
对两个位图进行按位与运算,得到新的位图,其中被设置为1的位表示两个集合都包含的元素。

取两个集合的并集:
对两个位图进行按位或运算,得到新的位图,其中被设置为1的位表示两个集合中任意一个集合包含的元素。

在这里插入图片描述

三、位图C++实现

位图实现的包含以下功能:

  • 构造函数:接受一个范围参数 range,创建一个大小适合存储范围内元素的位图。
  • 析构函数:释放位图占用的内存。
  • 初始化函数:将位图中的所有位都设置为0。
  • 增加函数:将给定的数字 num 添加到位图中。这里假设数字的范围在位图的有效范围内。
  • 删除函数:从位图中删除给定的数字 num
  • 查找函数:在位图中查找给定的数字 num,如果存在则返回 true,否则返回 false

注意事项:

  • 位图使用一个 unsigned int 数组来存储位的信息,每个 unsigned int 可以存储 32 个位。
  • 位图的大小由范围参数 range 决定,使用 range / 32 + 1 计算出所需的 unsigned int 数组的大小。
  • 数字 num 在位图中的索引位置由 num / 32 计算得到,表示在哪个 unsigned int 数组上。
  • 数字 num 在位图中的具体位索引由 num % 32 计算得到,表示在该 unsigned int 上的哪个位上。
#pragma once
 
#include <assert.h>
 
class BitMap
{
    
public:
    //构造函数
    BitMap(const size_t & range) {
    
        assert(range >= 0);
        if (bits != nullptr) {
    
            delete[] bits;
        }
        count = range;
        size = range / 32 + 1;
        bits = new unsigned int[size];
    }
    //析构函数
    ~BitMap() {
    
        delete[] bits;
    }
    //初始化数据,把所有数据置0
    void init() {
    
        for (int i = 0; i < size; i++)
            bits[i] = 0;
    }
    //增加数据到位图
    void add(const size_t & num) {
    
        assert(count > num);
        int index = num / 32;
        int bit_index = num % 32;
        bits[index] |= 1 << bit_index;
    }
    //删除数据到位图
    void remove(const size_t & num){
    
        assert(count > num );
        int index = num / 32;
        int bit_index = num % 32;
        bits[index] &= ~(1 << bit_index);
    }
    //查找数据到位图
    bool find(const size_t & num) {
    
        assert(count > num);
        int index = num / 32;
        int bit_index = num % 32;
        return (bits[index] >> bit_index) & 1;
    }
//位图相关数据
private:
    unsigned int* bits=nullptr;
    int size;
    int count;
};
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_44545838/article/details/132831134

智能推荐

海康威视网络摄像头开发流程(五)------- 直播页面测试_ezuikit 测试的url-程序员宅基地

文章浏览阅读3.8k次。1、将下载好的萤石js插件,添加到SoringBoot项目中。位置可参考下图所示。(容易出错的地方,在将js插件在html页面引入时,发生路径错误的问题)所以如果对页面中引入js的路径不清楚,可参考下图所示存放路径。2、将ezuikit.js引入到demo-live.html中。(可直接将如下代码复制到你创建的html页面中)<!DOCTYPE html><html lan..._ezuikit 测试的url

如何确定组态王与多动能RTU的通信方式_组态王ua-程序员宅基地

文章浏览阅读322次。第二步,在弹出的对话框选择,设备驱动—>PLC—>莫迪康—>ModbusRTU—>COM,根据配置软件选择的协议选期期,这里以此为例,然后点击“下一步”。第四步,把使用虚拟串口打勾(GPRS设备),根据需要选择要生成虚拟口,这里以选择KVCOM1为例,然后点击“下一步”设备ID即Modbus地址(1-255) 使用DTU时,为下485接口上的设备地址。第六步,Modbus的从机地址,与配置软件相同,这里以1为例,点击“下一步“第五步,Modbus的从机地址,与配置软件相同,这里以1为例,点击“下一步“_组态王ua

npm超详细安装(包括配置环境变量)!!!npm安装教程(node.js安装教程)_npm安装配置-程序员宅基地

文章浏览阅读9.4k次,点赞22次,收藏19次。安装npm相当于安装node.js,Node.js已自带npm,安装Node.js时会一起安装,npm的作用就是对Node.js依赖的包进行管理,也可以理解为用来安装/卸载Node.js需要装的东西_npm安装配置

火车头采集器AI伪原创【php源码】-程序员宅基地

文章浏览阅读748次,点赞21次,收藏26次。大家好,小编来为大家解答以下问题,python基础训练100题,python入门100例题,现在让我们一起来看看吧!宝子们还在新手村练级的时候,不单要吸入基础知识,夯实自己的理论基础,还要去实际操作练练手啊!由于文章篇幅限制,不可能将100道题全部呈现在此除了这些,下面还有我整理好的基础入门学习资料,视频和讲解文案都很齐全,用来入门绝对靠谱,需要的自提。保证100%免费这不,贴心的我爆肝给大家整理了这份今天给大家分享100道Python练习题。大家一定要给我三连啊~

Linux Ubuntu 安装 Sublime Text (无法使用 wget 命令,使用安装包下载)_ubuntu 安装sumlime text打不开-程序员宅基地

文章浏览阅读1k次。 为了在 Linux ( Ubuntu) 上安装sublime,一般大家都会选择常见的教程或是 sublime 官网教程,然而在国内这种方法可能失效。为此,需要用安装包安装。以下就是使用官网安装包安装的教程。打开 sublime 官网后,点击右上角 download, 或是直接访问点击打开链接,即可看到各个平台上的安装包。选择 Linux 64 位版并下载。下载后,打开终端,进入安装..._ubuntu 安装sumlime text打不开

CrossOver for Mac 2024无需安装 Windows 即可以在 Mac 上运行游戏 Mac运行exe程序和游戏 CrossOver虚拟机 crossover运行免安装游戏包-程序员宅基地

文章浏览阅读563次,点赞13次,收藏6次。CrossOver24是一款类虚拟机软件,专为macOS和Linux用户设计。它的核心技术是Wine,这是一种在Linux和macOS等非Windows操作系统上运行Windows应用程序的开源软件。通过CrossOver24,用户可以在不购买Windows授权或使用传统虚拟机的情况下,直接在Mac或Linux系统上运行Windows软件和游戏。该软件还提供了丰富的功能,如自动配置、无缝集成和实时传输等,以实现高效的跨平台操作体验。

随便推点

一个用聊天的方式让ChatGPT写的线程安全的环形List_为什么gpt一写list就卡-程序员宅基地

文章浏览阅读1.7k次。一个用聊天的方式让ChatGPT帮我写的线程安全的环形List_为什么gpt一写list就卡

Tomcat自带的设置编码Filter-程序员宅基地

文章浏览阅读336次。我们在前面的文章里曾写过Web应用中乱码产生的原因和处理方式,旧文回顾:深度揭秘乱码问题背后的原因及解决方式其中我们提到可以通过Filter的方式来设置请求和响应的encoding,来解..._filterconfig selectencoding

javascript中encodeURI和decodeURI方法使用介绍_js encodeur decodeurl-程序员宅基地

文章浏览阅读651次。转自:http://www.jb51.net/article/36480.htmencodeURI和decodeURI是成对来使用的,因为浏览器的地址栏有中文字符的话,可以会出现不可预期的错误,所以可以encodeURI把非英文字符转化为英文编码,decodeURI可以用来把字符还原回来_js encodeur decodeurl

Android开发——打包apk遇到The destination folder does not exist or is not writeable-程序员宅基地

文章浏览阅读1.9w次,点赞6次,收藏3次。前言在日常的Android开发当中,我们肯定要打包apk。但是今天我打包的时候遇到一个很奇怪的问题Android The destination folder does not exist or is not writeable,大意是目标文件夹不存在或不可写。出现问题的原因以及解决办法上面有说报错的中文大意是:目标文件夹不存在或不可写。其实问题就在我们的打包界面当中图中标红的Desti..._the destination folder does not exist or is not writeable

Eclipse配置高大上环境-程序员宅基地

文章浏览阅读94次。一、配置代码编辑区的样式 <1>打开Eclipse,Help —> Install NewSoftware,界面如下: <2>点击add...,按下图所示操作: name:随意填写,Location:http://eclipse-color-th..._ecplise高大上设置

Linux安装MySQL-5.6.24-1.linux_glibc2.5.x86_64.rpm-bundle.tar_linux mysql 安装 mysql-5.6.24-1.linux_glibc2.5.x86_6-程序员宅基地

文章浏览阅读2.8k次。一,下载mysql:http://dev.mysql.com/downloads/mysql/; 打开页面之后,在Select Platform:下选择linux Generic,如果没有出现Linux的选项,请换一个浏览器试试。我用的谷歌版本不可以,换一个别的浏览器就行了,如果还是不行,需要换一个翻墙的浏览器。 二,下载完后解压缩并放到安装文件夹下: 1、MySQL-client-5.6.2_linux mysql 安装 mysql-5.6.24-1.linux_glibc2.5.x86_64.rpm-bundle