大数据正式Zebra1_zebra 大数据 安装 csdn-程序员宅基地

技术标签: 达内实训  大数据学习痕迹  

Zebra1

进程

  • 进程
    • 程序加载到内存中之后被cpu所计算的过程,进程是计算机资源分配和任务调度的最小单位
  • 三个维度
    • 进程
      1. 物理内存维度:每一个进程都要分配一个连续的内存空间【首尾地址】
      2. 执行角度/逻辑角度:每个进程都可以被cpu计算,每一个进程都能挂起然后让另外的进程被cpu计算--对于单核cpu而言,每一个时刻只能执行一个进程【对于Windows而言,默认是一个核处理,对于linux而言,有几个核就可以用几个核】【微观:串行】【宏观:并行--多道编程】
      3. 时间角度:在每一个时间角度而言,进程是向前扑进的
  • 为什么要有进程
    1. 不引进进程,每个时刻只能有一个任务在执行,效率低下----减少响应时间,提高使用效率、
    2. IO事件发生时,cpu是不进行计算的【cpu的利用率=1-cpu的利用率n】,理论上来说,进程越多,cpu的利用率越高----提高cpu的利用率
  • 进程的生命周期
    • 产生
      1. 系统启动,会创建系统进程
      2. 用户请求创建进程
      3. 父进程(主进程)自动去启动子进程
    • 进程的消亡
      1. 正常消亡:进程正常结束
      2. 意外消亡:进程执行过程中出现错误或异常
      3. 他杀:一个进程被另外的进程强制关闭
  • 进程的状态
    • 就绪
    • 运行
    • 阻塞
  • 进程的状态转化
    • 就绪->运行
    • 运行->阻塞
    • 运行->就绪
    • 阻塞->就绪
  • 进程的任务调度算法
    1. 时间片轮询算法
    2. 优先级调度算法
    3. 短任务优先算法
    4. FIFS,先来先服务

线程

  • 线程
    • 是进程中执行的任务,线程本质上也是在完成任务、是简化版的进程
    • 一个进程中,至少有一线程在执行
    • 线程是任务执行的最小单位

Socket/ServerSocket

  • Bio(BlockingIO):阻塞式IO--阻塞在一些场景会相对影响效率,因为流有方向性,所以在数据传输的时候往往创建多个流对象,如果流长时间不关闭的话,会造成资源的大量的浪费,无法从流中抽取一段数据
  • Nio(NewIO)(NonBlockingIO):非阻塞式IO,基于通道和缓冲区
    • 通道【道路】
      • 没有方向性--即双向
    • 缓冲区【车】
      • 实际来传输数据的
  • Buffer
    • 一个用于特定基本类型的基本数据
    • 一般ByteBuffer居多
    • 图示
  • ByteBuffer

    • 抽象类
      • allocate--获取ByteBuffer对象
      • get取值
      • put设置值
      • flip反转缓冲区
      • limit限制位
      • position操作位
    • package com.peng.socket;
      
      import java.nio.ByteBuffer;
      
      import org.junit.Test;
      
      public class TestByteBuffer {
      
          @Test
          public void testByteBuffer() {
              // 属性
              // 1.capacity容量位--表示缓冲区的容量
              // 2.position操作位--表示要操作的位--当缓冲区刚刚创建的时候,默认为0--每添加一个字节的数据的时候,就 向后移一位
              // 3.limit限制位--表示position所能达到的最大位置--当缓冲区刚刚创建的时候,limit设置为何容量的大小一样
      
              // 创建缓存区,并且指定了 大小:1024字节
              ByteBuffer bb = ByteBuffer.allocate(1024);
              // 向缓冲区添加数据
              bb.put("hello".getBytes());
              System.err.println("当前的位置:" + bb.position());
              bb.position(0);// 操作位移到最前面
              System.err.println("第一个字节:" + bb.get());
              // 方法--翻转缓冲区flip:先将限制位设置为操作位,再将操作位设置为0
              // bb.flip();
              // 方法--rewind:重绕缓冲区--只是将操作位归零
      
              // 分界
              System.err.println("============分解符=============");
      
              // 如果知道具体的数据,建议使用这种方法
              ByteBuffer bb2 = ByteBuffer.wrap("hello".getBytes());
              System.err.println(bb2.get());
      
              while (bb2.hasRemaining()) {// 是否还有剩余数据
                  System.err.println(bb2.get());
              }
      
          }
      }
      

数组复制--保持数据的不变性--副本,不改变原数据

Channel

  • 用于I/O操作的连接
    • FileChannel
    • DataChannel
    • ServerSocketChannel
    • SocketChannel
  • 支持非阻塞连接
  • 抽象类
    • 创建:open函数
  • 双向通讯

Channel的连接步骤

  • 客户端
    1. 打开客户端通道
    2. 设置为非阻塞通讯
    3. 连接
    4. 人为阻塞--防止无效的连接
    5. 写出数据
  • 服务器端
    1. 打开服务器端的通道
    2. 绑定要监听的端口号
    3. 设置为非阻塞
    4. 接收连接
    5. 人为阻塞--防止没有获取的真正的连接
    6. 读取数据
  • 例子【客户端】

    @Test
    public void test() throws Exception {
        // 打开通道--默认为阻塞连接
        SocketChannel s = SocketChannel.open();
        // 设置为非阻塞
        s.configureBlocking(false);
        // 发起连接
        s.connect(new InetSocketAddress("localhost", 8090));
        // 人为阻塞--连接失败则会继续连接
        while (!s.finishConnect()) {
        }
        // 写数据
        s.write(ByteBuffer.wrap("hello".getBytes()));
        System.out.println("写出成功!");
    }
    
  • 例子【服务端】

    @Test
    public void testServerSocketChannel() throws Exception {
        // 打开通道--默认为阻塞连接
        ServerSocketChannel ss = ServerSocketChannel.open();
        // 设置为非阻塞
        ss.configureBlocking(false);
        // 绑定监听的端口
        ss.bind(new InetSocketAddress(8090));
        SocketChannel channel = ss.accept();
        // 人为阻塞
        while (channel == null) {
            channel = ss.accept();
        }
        // 设置为非阻塞
        // channel.configureBlocking(false);
        // 准备缓冲区
        ByteBuffer buffer = ByteBuffer.allocate(100);
        // 读出数据
        channel.read(buffer);
        // 反转缓冲区--方便之后处理数据
        buffer.flip();
        System.out.println("数据:" + new String(buffer.array(), 0, buffer.limit()));
        System.out.println("接收成功!");
    }
    

Selector选择器

  • 例子

    package com.peng.socket;
    
    import java.net.InetSocketAddress;
    import java.nio.ByteBuffer;
    import java.nio.channels.SelectionKey;
    import java.nio.channels.Selector;
    import java.nio.channels.ServerSocketChannel;
    import java.nio.channels.SocketChannel;
    import java.util.Iterator;
    import java.util.Set;
    
    import org.junit.Test;
    
    public class TestSelect {
        @Test
        public void test1() throws Exception {
            // 打开客户端通道
            SocketChannel sc = SocketChannel.open();
            // 非阻塞
            sc.configureBlocking(false);
            // 获取选择器
            Selector selc = Selector.open();
            // 将通道注册到选择器上
            sc.register(selc, SelectionKey.OP_CONNECT);// 注册connect权力
            // 发起连接
            sc.connect(new InetSocketAddress("localhost", 8090));
    
            while (true) {
                // 筛选--进行选择--是否包含发放的权力
                selc.select();
                // 获取筛选之后的 有用的事件
                Set<SelectionKey> keys = selc.selectedKeys();
                // 获取迭代器
                Iterator<SelectionKey> it = keys.iterator();
                // 遍历
                while (it.hasNext()) {
                    // 将遍历到的这个事件获取出来
                    SelectionKey key = it.next();
                    // 可能会发起连接
                    if (key.isConnectable()) {
                        // 获取到对应的通道
                        SocketChannel scx = (SocketChannel) key.channel();
                        // 判断连接是否成功
                        while (!scx.finishConnect()) {
                        }
                        // 重新注册写的权限
                        scx.register(selc, SelectionKey.OP_WRITE | SelectionKey.OP_READ);// 将会将原来的权限覆盖掉
                    }
                    // 可能会写数据
                    if (key.isWritable()) {
                        // 从事件身上获取通道
                        SocketChannel scx = (SocketChannel) key.channel();
                        // 写数据
                        String msg = "hello,hello";
                        scx.write(ByteBuffer.wrap(msg.getBytes()));
                        // 将权限进行修改
                        scx.register(selc, key.interestOps() & ~SelectionKey.OP_WRITE);// 取消写的权限
                    }
                    // 可能从服务器获取数据
                    if (key.isReadable()) {
                        // 从事件身上获取通道
                        SocketChannel scx = (SocketChannel) key.channel();
                        // 读数据
                        ByteBuffer buffer = ByteBuffer.allocate(1024);
                        scx.read(buffer);
                        buffer.flip();
                        System.out.println(new String(buffer.array(), 0, buffer.limit()));
                        // 将读的事件
                        scx.register(selc, key.interestOps() & ~SelectionKey.OP_READ);// 取消读的权限
                    }
                    // 防止事件处理失败--防止重复事件
                    it.remove();
                }
            }
        }
    
        /**
         * 服务器端
         * 
         */
        @Test
        public void serverTest() throws Exception {
            // 打开服务器的通道
            ServerSocketChannel ssc = ServerSocketChannel.open();
            // 绑定端口号
            ssc.bind(new InetSocketAddress(8090));
            // 设置为非阻塞
            ssc.configureBlocking(false);
            // 打开选择器
            Selector selc = Selector.open();
            // 注册到选择器上
            ssc.register(selc, SelectionKey.OP_ACCEPT);
    
            while (true) {
                // 进行选择
                selc.select();
                // 将时间获取出来
                Set<SelectionKey> keys = selc.selectedKeys();
                // 获取到迭代器
                Iterator<SelectionKey> it = keys.iterator();
                // 遍历
                while (it.hasNext()) {
                    SelectionKey key = it.next();
                    // 可能是接受事件
                    if (key.isAcceptable()) {
                        // 从事件身上获取通道
                        ServerSocketChannel scx = (ServerSocketChannel) key.channel();
                        // 判断连接是否成功
                        SocketChannel sc = scx.accept();
                        while (sc == null) {
                            sc = scx.accept();
                        }
                        sc.configureBlocking(false);
                        // 注册写的权限
                        sc.register(selc, SelectionKey.OP_WRITE | SelectionKey.OP_READ);// 将会将原来的权限覆盖掉}
                    }
                    // 可能是可写事件
                    if (key.isWritable()) {
                        // 从事件身上获取通道
                        SocketChannel scx = (SocketChannel) key.channel();
                        // 写数据
                        String msg = "hello,hello---------I'm Server ";
                        scx.write(ByteBuffer.wrap(msg.getBytes()));
                        // 将权限进行修改
                        scx.register(selc, key.interestOps() & ~SelectionKey.OP_WRITE);// 取消写的权限
                    }
    
                    // 可能是可读事件
                    if (key.isReadable()) {
                        // 从事件身上获取通道
                        SocketChannel scx = (SocketChannel) key.channel();
                        // 读数据
                        ByteBuffer buffer = ByteBuffer.allocate(1024);
                        scx.read(buffer);
                        buffer.flip();
                        System.out.println(new String(buffer.array(), 0, buffer.limit()));
                        // 修改权限
                        scx.register(selc, key.interestOps() & ~SelectionKey.OP_READ);// 取消读的权限
                    }
                    // 防止事件处理失败--防止重复事件
                    it.remove();
                }
            }
        }
    }
    
  • 执行结果
    • 一个服务端,处理多个客户端的请求
  • 监听事件
    1. 连接一般是客户端
    2. 接受一般是服务器
    3. 读写--客户端和服务端都有

NIO

  • 数据可以双向传输-- 减少了流的数量,降低服务器的内存消耗
  • 由于数据是在缓冲区的,所以可以针对缓冲区的数据做定向操作【视频剪切后加头后还能进行小段播放】
  • 能够用一个或少量的服务器来完成大量的用户的请求处理,适用于短任务请求【长任务适用于Socket,点对点】

比较【bio(Socket)与Nio】

bio nio
流有方向 通道,在一个通道上可以进行数据的输入和输出
流的数据数连续不断地,不能很灵活的操作数据 Buffer传输数据的载体,是一个缓冲区,本质上是一个数组结构,缓冲区的大小可以自由控制(注意:实际大小不要超过32GB)
阻塞通信模型--一个请求产生一个线程 非阻塞性通讯模型--一个线程或几个线程处理多用户的请求
不适合高并发和高访问,适合长请求 适合做高并发和高访的场景,短请求的场景
  关键技术:buffer,channel

问题

  • A和B同时发送大量的数据,产生了数据粘包,如何处理
    • 思路
      1. 定长--如果数据长度不够,填充无用数据--无用数据的区分
      2. 约定结尾的符号--结束符号可能会与实际内容冲突、
      3. 序列化/反序列化【一般用这个】--【约定了起始和结束的协议】

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/eieiei438/article/details/79390366

智能推荐

02-Vue.js环境准备-使用vue-cli快速搭建项目(cli2)_pick a test runner-程序员宅基地

文章浏览阅读3.1w次,点赞6次,收藏8次。一、概述在用Vue.js构建大型应用时,推荐使用npm安装,npm能很好的和webpack等打包工具配合使用。如果使用npm过程中安装速度过慢,可以考虑使用淘宝镜像的cnpm来代替npm。首先Vue的安装依赖于Node.js,要保证你的计算机上已经安装过Node.js。可以参考前面的文章:https://blog.csdn.net/GJYSK/article/details/108210708如何查看Node是否安装或者Node版本呢?进入cmd,输入命令:node -v,回车查看,node最好使_pick a test runner

鸿蒙-环境搭建手册js版,2024年最新HarmonyOS鸿蒙高级开发面试题以及答案-程序员宅基地

文章浏览阅读768次,点赞21次,收藏30次。使用DevEco Studio远程模拟器需要华为帐号进行实名认证,建议在注册华为帐号后,立即提交实名认证审核,认证方式包括“个人实名认证”和“企业实名认证”,详情请参考。如果网络不能直接访问Internet,而是需要通过代理服务器才可以访问,这种情况下,需要设置Gradle代理,来访问和下载Gradle所需的依赖。否则,请跳过本章节。时,使用npm安装JS依赖的速度,建议在命令行工具中执行如下命令,重新设置npm仓库地址。只有在同时满足以下两个条件时,需要配置npm代理,否则,请跳过本章节。

计算机毕业设计springboot基于移动平台的粮食收购系统小程序px9rd9【附源码】_收购粮食质量调查小程序-程序员宅基地

文章浏览阅读47次。选题背景:随着移动互联网的快速发展和智能手机的普及,移动平台已经成为人们日常生活中不可或缺的一部分。同时,粮食收购作为农业产业链中重要的环节之一,对于保障国家粮食安全和农民利益具有重要意义。然而,传统的粮食收购系统存在着信息不对称、效率低下等问题,无法满足现代化管理的需求。因此,开发一款基于移动平台的粮食收购系统小程序具有重要的现实意义。选题意义:首先,基于移动平台的粮食收购系统小程序可以提高信息的透明度和公正性。通过将粮食收购过程数字化,可以实时记录和监控粮食收购的各个环节,包括农民种植、仓储、运_收购粮食质量调查小程序

程序设计思维与实践 Week10 作业 B LIS & LCS_给定两个单调递增的整数序列a和b,两个序列长度不一定等长,-程序员宅基地

文章浏览阅读193次。题目描述:给定两个序列A和B。求序列A的LIS和序列AB的LCS的长度。注意,LIS为严格递增的,即a1<a2<…<ak(ai<=1,000,000,000)。input:第一行两个数n,m(1<=n<=5,000,1<=m<=5,000)第二行n个数,表示序列A第三行m个数,表示序列Boutput:输出一行数据ans1..._给定两个单调递增的整数序列a和b,两个序列长度不一定等长,

三、移植u-boot-2016.03到Jz2440之修改时钟、内存控制器设置、UART设置_uboot下调整flash的时钟频率-程序员宅基地

文章浏览阅读571次。3.1 u-boot-2016.03 修改时钟、设置内存控制器、配置UART_uboot下调整flash的时钟频率

Linux进程管理和计划任务_/usr/sbin/networkmanager --no-daemon-程序员宅基地

文章浏览阅读202次。一、显示统计占用系统内存最多的进程,并排序。ps aux --sort -%mem ps aux --sort -rssps aux --sort -rssizeps aux --sort -rsz[root@centos /]# ps aux --sort -rssize | head -5USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMANDroot 1108 0.0 1.9 574_/usr/sbin/networkmanager --no-daemon

随便推点

tb_0030出现违反唯一性约束的问题_违反表的唯一约束性try catch-程序员宅基地

文章浏览阅读958次。tb_0030是SEMQ的待确认消息表,存储已接收但等待发送方确认已送达的记录,f003v_0030是确认记录键,可以唯一对应到系统范围内的所有SEMQ实例中的待发送记录.f003v_0030由节点类型,节点id,SEMQ实例id,SEMQ存储id,记录编号组成.tb_0030在f003v_0030上建立唯一索引.可以提高定位速度. 运行过程中出现了重复insert导致违反约束的情_违反表的唯一约束性try catch

Linux升级java17_linux更新java17-程序员宅基地

文章浏览阅读1.8k次。Linux升级Java17_linux更新java17

微信网页版登陆原理_wxsid-程序员宅基地

文章浏览阅读1.2k次。微信网页版登陆原理请求微信服务器返回一个会话ID微信Web版本不使用用户名和密码登录,而是采用二维码登录,所以服务器需要首先分配一个唯一的会话ID,用来标识当前的一次登录,通过请求地址:_wxsid

什么是软件测试-程序员宅基地

文章浏览阅读1.2w次,点赞6次,收藏36次。综上所述,软件测试的目的可以概括如下:软件测试是想以最少的人力、物力和时间找出软件中潜在的各种错误和缺陷,通过修正各种错误和缺陷提高软件质量,回避软件发布后由于潜在的软件缺陷和错误造成的隐患所带来的商业风险。随着软件工程化越来越被重视以及软件规模的不断扩大,软件分析、设计的作用越来越突出,而在实践中,越来越多的错误是在刚开始的分析与设计阶段就已经存在,所以对于软件需求和设计阶段的测试就显得非常重要,这就是测试概念的扩大化以及软件全。软件质量是软件特性的总和,软件满足规定或潜在用户需求的能力。..._软件测试

2022 ICPC 亚洲区域赛(杭州)赛后总结-程序员宅基地

文章浏览阅读1.1k次。寄!我愿称之为最抽象的一站20分钟连过两个签到,状态起飞,然后全程坐牢未过一题~~不过这次并没有什么遗憾,因为确实够不到铜牌的边缘,看到同校队伍济南站银牌,这一场打铁,我们也就释然了只能说以后的时间里继续训练,提升自己的实力,明年ICPC再战吧。今年的竞赛就到一段落了,之前欠下的许多实验报告也该赶一赶了,希望明年能以一个更强的实力,参与到各路高手的对局中ICPC 再会

用Python来实现2024年春晚刘谦魔术_python刘谦魔术-程序员宅基地

文章浏览阅读4.8k次,点赞29次,收藏50次。用Python来实现2024年春晚刘谦魔术。其实说实话,这种数学魔术在我小时候买的书里就曾经看到过许多。虽然现在了解了其中的数学原理,但当时的惊奇与欢乐感觉依然难以忘怀。刘谦老师在表演中展现了非凡的技艺,不仅仅是数学的巧妙运用,更是他善于抓住观众的好奇心,创造出让人难以置信的奇迹。St_python刘谦魔术