为深化产教融合,提升学生实践能力,2025年6月28日至7月2日信息工程学院组织2023级数据科学与大数据技术专业112名学生赴校企合作基地——云和数据信息技术有限公司,开展为期5天的《金融行业数据仓库项目实训》。本次实习以企业真实项目为载体,通过Hadoop生态技术实战,帮助学生掌握金融大数据应用全流程。

本次实习围绕金融信贷业务场景,构建完整的数据仓库解决方案。项目基于Hadoop大数据平台,采用Hive作为核心存储与计算引擎,通过DataX实现多源数据采集,并利用DolphinScheduler进行ETL任务调度,最终形成覆盖贷款申请、审批、放款、还款全流程的数据分析体系。


核心实习内容分包括数据采集与存储、ETL开发与调度、数据应用开发、安全与治理四大模块。实习采用“阶梯式”任务设计,从环境搭建到项目交付逐日进阶。通过该项目,学生不仅学习了MySQL到Hive的数据同步技术,还掌握了DataX工具配置与Hive表结构设计,使用DolphinScheduler创建了定时ETL任务,完成了配置任务监控,优化了Hive性能,构建了信贷客户画像标签体系,开发了风险指标计算模型,并通过Alluxio加速了热点数据查询。

通过本次实习,学生不仅掌握金融科技领域主流技术栈,更深度理解数据仓库在风控、营销等业务场景的价值。每位同学通过提交实习报告,重点总结性能优化与合规实践经验,为未来从事大数据开发、数据分析岗位奠定基础。