Skip to content

lzneu/2018-Industrial-Big-Data-Top2-Solution

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 

Repository files navigation

2018-Industrial-Big-Data-Top2-Solution

智能制造工业AI Top2解决方案

产品特性预测

赛题背景:

半导体产业是一个信息化程度高的产业。高度的信息化给数据分析创造了可能性。基于数据的分析可以帮助半导体产业更好的利用生产信息,提高产品质量。 现有的解决方案是,生产机器生产完成后,对产品质量做非全面的抽测,进行产品质量检核。这往往会出现以下状况,一是不能即时的知道质量的好坏,当发现质量不佳的产品时,要修正通常都为时以晚,二是在没有办法全面抽测的状况下,存在很大漏检的风险。 在机器学习,人工智能快速发展的今天,我们希望着由机器生产参数去预测产品的质量,来达到生产结果即时性以及全面性。更进一步的,可基于预先知道的结果,去做对应的决策及应变,对客户负责,也对制造生产更加敏感。

痛点与挑战:

1)TFT-LCD(薄膜晶体管液晶显示器)的生产过程较为复杂,包含几百道以上的工序。每道工序都有可能会对产品的品质产生影响,故算法模型需要考虑的过程变量较多。 2)另外,这些变量的取值可能会存在异常(如测点仪表的波动导致、设备工况漂移等现象),模型需要足够稳定性和鲁棒性。 3)产线每天加工的玻璃基板数以万计,模型需要在满足较高的精准度前提下尽可能实时得到预测结果,这样才能给在实际生产中进行使用。

价值:

1)如果能够建立算法模型准确预测出特性值,便可以实现生产过程的实时监控和预警,提前发现当前工序的问题、避免问题流入到后道工序,减少生产资源浪费的同时也优化了产品良率。 2)基于预测模型得到的关键参数,工艺人员能够快速地针对那些电性表现不佳的产品进行问题溯源分析,重点分析和调整那些关键的影响因子,加快不良问题的处理、提高整体工艺水平。 3)该预测模型在部署后也可以用于减少特性检测相关的工序,能够节约检测资源并且对提升产线整体的产能有正面作用。

问题描述:

比赛提供了生产线上的数据,反应机台的温度,气体,液体流量,功率,制成时间等因子。通过这些因子,需要选手设计出模型,准确的预测与之相对应的特性数值。这是一个典型的回归预测问题。因为数据中可能存在异常等现象,比赛鼓励选手发挥想象力,创造力,去设计出智能的算法。初赛阶段将提供3个星期左右的数据,复赛阶段提供数据待定,决赛阶段需要选手给出因子的重要性排序或者分类,供评委参考并作为最终评判指标的一个考量。

评测指标:

MSE 本竞赛排行榜分A/B榜,A榜数据100条,B榜数据121条。最终线上成绩与排名以B榜成绩与排名为主(B榜重新排名,需要再提交答案,B榜成绩只在初赛最后两天公布)。

About

智能制造工业AI Top2解决方案

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 100.0%