ideX
Last updated
Was this helpful?
Last updated
Was this helpful?
ideX是一款集合数据挖掘、可视化、定时任务于一体的数据分析产品,其主要功能特性有:
SQL分析执行(SQL Analyzer)
Notebook
可视化(Visualization)
多人协作编辑(Collatorative editing)
如下图所示,在数据分析页面中左侧点击ideX图标则进入主页。
ideX UI布局如下图所示:
使用ideX需要创建文件,所有的操作都是在文件里面执行的。在左侧脚本树页签中可以自由创建和组织文件、文件夹。如下图所示,在我的项目上右键弹出的菜单中选择新增文件夹可以创建子文件夹,在该子文件夹下右键又可以进一步进行上述操作。
在文件和空文件夹上右键可以删除,删除后的文件或者空文件夹可以在回收站中找到并右键恢复,类似于windows操作系统的回收站。分享区在随后讨论。
在左侧元数据库页签中可以查看有权限的数据库和表,如下图所示。其中集群选择“default”即可,保留用于后面多集群的支持,在数据库下拉框中可以选择数据库,在数据表下拉框中可以选择和查看有权限的表名及表结构。
元数据库中的库表根据所选择项目的不同而变化。每个项目有权限的库表可以在套件首页【数据资产】->【库表管理】中进行配置(创建、修改、删除等)。
注意:如果没有数据库或这表的权限请在库表管理中查看或申请,元数据库中的库和表数据都来源于库表管理模块。
左侧的函数库页签提供了一些常用的hive函数用法的快速检索帮助文档,如下图所示,在输入框输入函数名回车后即可显示搜索到的函数,点击其中的函数名在下方会显示函数的用法信息。也可以根据函数分类展开查找相关函数。
新建sql文件后,可以看到总体布局如下图所示:
菜单栏如下图所示:
光标悬浮可以看到各个图标的功能说明。从左至右依次是运行按钮、保存按钮、sql格式化按钮、查看执行计划按钮、版本管理按钮、分享按钮、参数化运行按钮、常用数据库选择切换按钮、full/slight模式切换按钮。
sql文本输入区可以输入多个sql,sql与sql之间使用";"隔开,可以点击批量顺序执行,也可以选中部分运行。运行有slight模式和full模式两种,默认为slight模式,slight模式查询效率较高,但最大返回结果集为2万条;full模式查询效率较低,可以下载全量结果集。如无特殊需求建议使用默认的slight模式执行sql。
执行sql后,在下方的“进度”页签中可以看到执行进度,在“资源”页签中可以看到当前资源池的资源情况,资源池是跟随项目而变化的,切换项目则资源池也会变化。在“日志”页签中可以查看到执行的日志,当执行结束后则在“结果”页签中会显示查询结果。此外还可以在“历史”页签中查看sql的历史执行情况。当点击顶部“查询计划”按钮时会在下方的“查询计划”页签中显示查询计划。
点击sql文件上方右侧的“运行参数”按钮,则会弹出运行参数文本框,在文本框中可以设置运行参数。参数有枚举型、范围型、固定型三种。设置运行参数时key为变量名,value为具体的参数值,当设置后,就会使用参数替换文件中形如${var}的placeholder。举例来说,如果sql中有形如${name}的placeholder,当设置key名为name的运行参数时,则会使用设置的参数替换sql中的placeholder。如不确定可以在“运行参数”对话框中点击“预览”按钮查看实际执行的sql是否符合预期。
新建.md文件后即可输入编辑markdown文本,markdown文件的写法是通用的,如不熟悉可以搜索相关写法,这里不再赘述。
notebook文件后缀名为.ipynb,用来执行python以及pyspark代码。启动notebook需要消耗一定的集群资源,一般需要30秒左右启动,如果集群负载较高则启动时间会更长。当左侧状态栏显示为“内核空闲”时则可输入python代码并执行。
三种类型的文件均可以进行分享,分享的对象是同一项目内的其他用户。分享的时候可以指定读、写、和执行的权限,类似于linux文件系统的权限管理。点击确定后,则被分享者登录后可以在分享区看到其他用户分享过来的文件。被分享的文件在左侧会显示分享标志。分享后的文件也可以取消分享,在分享设置中把相应用户删除即可。
三种类型的文件均可以进行版本管理。当文件内容发生变动且点击保存按钮时则会生成新的版本,页面只显示最近的5个版本。另外如sql文件等也有自动保存功能,当文件发生改动后大概一分钟左右会自动保存从而生成新的版本。
Q:执行的sql语法标准是什么? A:SQL是标准的HIVE2 SQL。
Q:notebook执行的pyspark是定制过的吗,版本是多少? A:pyspark是标准的spark2.1版本。
Q:notebook可以自动补全吗? A:可以按tab键进行补全。
当选择新增文件时,需要对文件取一个唯一的名称。可以创建三种类型的文件,分别为sql、markdown、notebook,如下图所示。