加入收藏 | 设为首页 | 会员中心 | 我要投稿 阳江站长网 (https://www.0662zz.cn/)- 办公协同、云通信、区块链、物联平台、高性能计算!
当前位置: 首页 > 站长资讯 > 外闻 > 正文

必知的Spark SQL几种Join实现

发布时间:2021-02-12 13:45:40 所属栏目:外闻 来源:互联网
导读:图表的拓扑排序是对其顶点进行线性排序,因此对于排序中的每条有向边(u, v),顶点u都在v之前。图8显示了顶点(1、2、3、5、4、6、7、8)的拓扑排序示例。可以看到,顶点5应在顶点2和3之后。同样,顶点6应该在顶点4和5之后。 算法: 卡恩算法 基于深度优先算法

图表的拓扑排序是对其顶点进行线性排序,因此对于排序中的每条有向边(u, v),顶点u都在v之前。图8显示了顶点(1、2、3、5、4、6、7、8)的拓扑排序示例。可以看到,顶点5应在顶点2和3之后。同样,顶点6应该在顶点4和5之后。

算法:

  • 卡恩算法
  • 基于深度优先算法

应用:

  • 用于指令调度
  • 用于数据序列化
  • 用于确定要在生成文件中执行的编译任务的顺序
  • 用于解析链接器中的符号依赖关系

8.图着色
 

如果图表中的每个顶点都能通过其他顶点到达,那么这个图就是强连通的。图7包含三个强连接分量,顶点分别用红色、绿色和黄色表示。

算法:

  • Kosaraju算法
  • Tarjan强连通分量算法

应用:

  • 用于计算Dulmage Mendelsohn分解,是二分图表边的一种分类。
  • 用于社交网络中,根据共同爱好,发现并推荐具有密切联系的人。

7.拓扑排序
 

最小生成树是图表边的子集,它连接所有边权值最小和的顶点,不包含任何循环。图6是一个获得最小生成树过程的动画。

算法:

  • 普林演算法
  • 克鲁斯卡尔算法

应用:

  • 用于在计算机网络中构建广播树
  • 用于基于图表的聚类分析
  • 用于图像分割
  • 用于社会地理领域的区域化,将区域划分为相邻区域。

6.强连通分量

(编辑:阳江站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读