只写了最简单的方式,其中b需要是列向量,用分号隔开元素;
Ax = b
其中矩阵A(nxn) 和列向量 b(n) 已知;方程组的解存储在 x中,在matlab中写作:
> x=A\b
octave:7> A=[1,2; 1.0001, 2;]
A =
1.0000 2.0000
1.0001 2.0000
octave:8> b=[3; 3.0001;]
b =
3.0000
3.0001
octave:9> x=A\b
x =
1.0000
1.0000
octave:10> b-A*x
ans =
0
0
octave:11>
迭代法的原理,是创建一个n维的无穷项的收敛数列,收敛的极限点 x 满足方程 Ax = b ;
使用矩阵A来制造收敛数列,有一些技巧,这里的示例由于 A 是严格主元占优的,所以比较容易制造收敛,直接挖掉了对角元;
详细原理可以参考数值计算教材,用到了矩阵的诱导范数、谱半径等相关的定理,并不复杂;
这里为了表述原理,我采用了矩阵语言的算法实现,大概原理如下,原理写的不太规范,凑活着跳过即可:
/********************************
*
* ******Ax = b*********
* x = Bx + f
* x = -D'(L+U)x + D'b
*
* Dx = b - (L+U)x
* ***********************下面是迭代过程
* X1=(L+U) * X0
* X1=b-X1
* Dx = X1 ***(这里D是对角阵,所以直接做标量除法即可得到x)
* x = D^-1 * X1
* X0 = x
*
* ******************************/
矩阵语言的实现有两个好处,一个是便于传统的理论分析,比如收敛性分析等,另一个好处是有利于 gpu并行实现;
这里给出最简单的 Jacobi 迭代法求 Ax=b 的解;
gcc 直接编译即可运行;
jacobi.cpp
源码:
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#define NA 3
void test_sgemv(int op, int N, float a, float *AA, int lda, float b, float *yy);
void sgemv(int op, int N, float a, float *A, int lda, float b, float *y); // y = a*op(A)*X + b*y
void print_matrix(float *A, int N, int lda);
void print_vector(float *V, int N);
void set_LpU(float *LpU, float *A, int N);
void set_D(float *D, float *A, int N);
void Saxpy(int n, float alpha, float *x, float beta, float *y); //y = a*x + b*y
void x_div_y(int N, float* x, float* y);//x[i] = x[i]/y[i];
void Scopy(int n, float* x, float* y);// x -> y
void Saxpy(int n, float alpha, float *x, float beta, float *y) //y = a*x + b*y
{
for(int i=0; i<n; i++){
y[i] = alpha*x[i] + beta*y[i];
}
}
void x_div_y(int N, float* x, float* y){//x[i] = x[i]/y[i];
for(int i=0; i<N; i++)
x[i] = x[i]/y[i];
}
void Scopy(int n, float* x, float* y)// x -> y
{
for(int i=0; i<n; i++)
y[i] = x[i];
}
void Jacobi_Ax_b(float *A, float *b, float *X0, float *Xk, int N, float eps, int iter){
float *LpU = nullptr;
//float *X0 = nullptr;
//float *X1 = nullptr;
float *D = nullptr;
LpU = (float*)malloc( N*N*sizeof(float));
//X0 = (float*)malloc( N*sizeof(float));
//X1 = (float*)malloc( N*sizeof(float));
D = (float*)malloc( N*sizeof(float));
//1.0 set LpU, set D, X0 = 0;
set_LpU(LpU, A, N); printf("LpU =\n"); print_matrix(LpU, N, N);
set_D(D, A, N); printf("D =\n"); print_vector(D, N);
memset(X0, 0, N*sizeof(float)); printf("X0 =\n"); print_vector(Xk, N);
//2.0 loop
/* S1 X1=LU* x0
* S2 X1=b-X1
* S3 Dx = X1
* S4 X1 = X1/D
*/
for(int it=0; it<iter; it++){
//void sgemv(int op, int N, float a, float *A, int lda, float b, float *y);
// S1 X1=LU* X0
sgemv(0, N, 1.0f, LpU, N, 0.0f, Xk);
//void Saxpy(int n, float alpha, float *x, float beta, float *y); //y = a*x + b*y
// S2 X1=b-X1
Saxpy(N, 1.0f, b, -1.0f, Xk);
//void x_div_y(int N, float* x, float* y){//x[i] = x[i]/y[i];
// S3 DXk+1 = Xk
x_div_y(N, Xk, D);
}
//Scopy(N, X1, xk);
}
void set_LpU(float *LpU, float *A, int N){
for(int i=0; i<N; i++){
for(int j=0; j<N; j++){
LpU[i + j*N] = A[i + j*N];
if(i == j)
LpU[i+i*N] = 0.0f;
}
}
}
void set_D(float *D, float *A, int N){
for(int i=0; i<N; i++)
D[i] = A[i + i*N];
}
void sgemv(int op, int N, float a, float *A, int lda, float b, float *y){
// y = a*op(A)*X + b*y
float* y0 = nullptr;
y0 = (float*)malloc(N*sizeof(float));
memcpy(y0, y, N*sizeof(float));
for(int i=0; i<N; i++){
float sigma = 0.0f;
for(int j=0; j<N; j++){
sigma += A[i + j*lda]*y0[j];
}
y[i] = a*sigma + b*y[i];
}
free(y0);
}
void print_matrix(float *A, int N, int lda){
printf("\n");
for(int i=0; i<N; i++){
for(int j=0; j<N; j++){
printf("%8.3f ", A[i + j*lda]);
}
printf("\n");
}
printf("\n");
}
void print_vector(float *V, int N){
printf("\n");
for(int i=0; i<N; i++){
printf("%f ", V[i]);
}
printf("\n");
}
//void sgemv(int op, int N, float a, float *A, int lda, float b, float *y){
void test_sgemv(int op, int N, float a, float *AA, int lda, float b, float *yy){
float *y = nullptr;
float *A = nullptr;
y = (float*)malloc(N*sizeof(float));
A = (float*)malloc(N*N*sizeof(float));
memcpy(y, yy, N*sizeof(float));
memcpy(A, AA, N*N*sizeof(float));
printf("\nA =\n");
print_matrix(A, N, N);
printf("\ny =\n");
print_vector(y, N);
sgemv(1, N, a, A, lda, b, y);
printf("\n y=Ax+y=\n");
print_vector(y, N);
free(y);
free(A);
}
int main(){
float A[NA*NA] =
{
10, -1, -1, -1, 10, -1, -2, -2, 5
// 10, 2, 1, 3, -10, 3, 1, 3, 10// column major
/*
10, 3, 1,
2, -10, 3,
1, 3, 10*/
};
float b[NA]={
7.2, 8.3, 4.2
//14, -5, 14
};
// void test_sgemv(int op, int N, float a, float *AA, int lda, float b, float *yy){
//test_sgemv(1, NA, 1.0f, A, NA, 1.0f, b);
float* Ah = nullptr;
float* bh = nullptr;
int N = NA;
Ah = (float*)malloc(N*N*sizeof(float));
bh = (float*)malloc(N*sizeof(float));
memcpy(Ah, A, N*N*sizeof(float));
memcpy(bh, b, N*sizeof(float));
printf("Ah =\n");
print_matrix(Ah, N, N);
float *x0 = nullptr;
float *x1 = nullptr;
x0 = (float*)malloc(N*sizeof(float));
x1 = (float*)malloc(N*sizeof(float));
float eps = 1.0e-7;
int iter = 15;
Jacobi_Ax_b(Ah, bh, x0, x1, N, eps, iter);
print_vector(x1, N);
return 0;
}
编译:
Makefile
Jacobi: hello_Jacobi.cpp
g++ -g $< -o $@
.PHONY: clean
clean:
-rm -rf Jacobi
絮叨地提示一下,g++ 行的前面是一个 tab空格,Makefile的语法要求,-rm 前面也是;
运行:
文章浏览阅读1.6k次。安装配置gi、安装数据库软件、dbca建库见下:http://blog.csdn.net/kadwf123/article/details/784299611、检查集群节点及状态:[root@rac2 ~]# olsnodes -srac1 Activerac2 Activerac3 Activerac4 Active[root@rac2 ~]_12c查看crs状态
文章浏览阅读1.3w次,点赞45次,收藏99次。我个人用的是anaconda3的一个python集成环境,自带jupyter notebook,但在我打开jupyter notebook界面后,却找不到对应的虚拟环境,原来是jupyter notebook只是通用于下载anaconda时自带的环境,其他环境要想使用必须手动下载一些库:1.首先进入到自己创建的虚拟环境(pytorch是虚拟环境的名字)activate pytorch2.在该环境下下载这个库conda install ipykernelconda install nb__jupyter没有pytorch环境
文章浏览阅读5.2k次,点赞19次,收藏28次。选择scoop纯属意外,也是无奈,因为电脑用户被锁了管理员权限,所有exe安装程序都无法安装,只可以用绿色软件,最后被我发现scoop,省去了到处下载XXX绿色版的烦恼,当然scoop里需要管理员权限的软件也跟我无缘了(譬如everything)。推荐添加dorado这个bucket镜像,里面很多中文软件,但是部分国外的软件下载地址在github,可能无法下载。以上两个是官方bucket的国内镜像,所有软件建议优先从这里下载。上面可以看到很多bucket以及软件数。如果官网登陆不了可以试一下以下方式。_scoop-cn
文章浏览阅读4.5k次,点赞2次,收藏3次。首先要有一个color-picker组件 <el-color-picker v-model="headcolor"></el-color-picker>在data里面data() { return {headcolor: ’ #278add ’ //这里可以选择一个默认的颜色} }然后在你想要改变颜色的地方用v-bind绑定就好了,例如:这里的:sty..._vue el-color-picker
文章浏览阅读640次。基于芯片日益增长的问题,所以内核开发者们引入了新的方法,就是在内核中只保留函数,而数据则不包含,由用户(应用程序员)自己把数据按照规定的格式编写,并放在约定的地方,为了不占用过多的内存,还要求数据以根精简的方式编写。boot启动时,传参给内核,告诉内核设备树文件和kernel的位置,内核启动时根据地址去找到设备树文件,再利用专用的编译器去反编译dtb文件,将dtb还原成数据结构,以供驱动的函数去调用。firmware是三星的一个固件的设备信息,因为找不到固件,所以内核启动不成功。_exynos 4412 刷机
文章浏览阅读2w次,点赞24次,收藏42次。Linux系统配置jdkLinux学习教程,Linux入门教程(超详细)_linux配置jdk
文章浏览阅读3.3k次,点赞5次,收藏19次。xlabel('\delta');ylabel('AUC');具体符号的对照表参照下图:_matlab微米怎么输入
文章浏览阅读119次。顺序读写指的是按照文件中数据的顺序进行读取或写入。对于文本文件,可以使用fgets、fputs、fscanf、fprintf等函数进行顺序读写。在C语言中,对文件的操作通常涉及文件的打开、读写以及关闭。文件的打开使用fopen函数,而关闭则使用fclose函数。在C语言中,可以使用fread和fwrite函数进行二进制读写。 Biaoge 于2024-03-09 23:51发布 阅读量:7 ️文章类型:【 C语言程序设计 】在C语言中,用于打开文件的函数是____,用于关闭文件的函数是____。
文章浏览阅读3.4k次,点赞2次,收藏13次。跟随鼠标移动的粒子以grid(SOP)为partical(SOP)的资源模板,调整后连接【Geo组合+point spirit(MAT)】,在连接【feedback组合】适当调整。影响粒子动态的节点【metaball(SOP)+force(SOP)】添加mouse in(CHOP)鼠标位置到metaball的坐标,实现鼠标影响。..._touchdesigner怎么让一个模型跟着鼠标移动
文章浏览阅读178次。项目运行环境配置:Jdk1.8 + Tomcat7.0 + Mysql + HBuilderX(Webstorm也行)+ Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。项目技术:Springboot + mybatis + Maven +mysql5.7或8.0+html+css+js等等组成,B/S模式 + Maven管理等等。环境需要1.运行环境:最好是java jdk 1.8,我们在这个平台上运行的。其他版本理论上也可以。_基于java技术的停车场管理系统实现与设计
文章浏览阅读3.5k次。前言对于MediaPlayer播放器的源码分析内容相对来说比较多,会从Java-&amp;gt;Jni-&amp;gt;C/C++慢慢分析,后面会慢慢更新。另外,博客只作为自己学习记录的一种方式,对于其他的不过多的评论。MediaPlayerDemopublic class MainActivity extends AppCompatActivity implements SurfaceHolder.Cal..._android多媒体播放源码分析 时序图
文章浏览阅读2.4k次,点赞41次,收藏13次。java 数据结构与算法 ——快速排序法_快速排序法