收集Github中开源项目的数据,用于实验分析 如:评估领导者特征,研究其对项目成功的影响 Github中可以获得的信息 项目的选择

Slides:



Advertisements
Similar presentations
旅 糾 紛 遊 與緊急事件處理 11 Chapter 旅遊費用.
Advertisements

漫畫風雲.
第十一章 失业与通货膨胀理论.
C++面试笔试精要 张立伦 讲师的CSDN博客地址
旅 糾 紛 遊 與緊急事件處理 16 Chapter 飯店問題.
项目九 汽车维修服务核心流程.
绩效考评表格设计 班级:15服务4班 姓名:杨冬茜.
有效學習計劃簡介 (學前).
第十讲 组织的沟通过程.
工作任务23 冷却系结构 工作任务24 发动机防冻液相关知识 工作任务25 冷却系的检修
贵阳医学院神奇民族医药学院 社会科学部 谭宗扬
和大樹做朋友 一起去探索兒童公園的動植物生態吧! 財源老師技術指導、詩韻老師整理製作.
Oracle数据库 Oracle 子程序.
第一节 人体的稳态 (第一课时) 学习目标 说明稳态的生理意义 描述体温调节过程.
第三篇 组织工作.
科學科 污染 空氣 成因 的 : 題目 及 減少空氣污染的方法 陳玉玲 (4) 姓名 : 去到目錄.
综合实践活动管理系统 操作指南 ---学生篇
施耐德电气(中国)投资有限公司 运动控制部技术经理 李幼涵 高级工程师
Information & Security System in China China North Eastern Air Traffic Control Bureau (CAAC) Customer Background Subsidiary of General Administration of.
Hadoop I/O By ShiChaojie.
Harvard ManageMentor®
SVN的基本概念 柳峰
面向对象建模技术 软件工程系 林 琳.
R in Enterprise Environment 企业环境中的R
项目管理 Project Management
辅导课程六.
第11章:一些著名开源软件介绍 第12章:服务安装和配置 本章教学目标: 了解当前一些应用最广泛的开源软件项目 搭建一个网站服务器
Visual Studio Team System 简介
蔡哲民 信望愛聖經網站董事與技術組負責人 崑山科技大學資訊傳播系助理教授
格物资讯开放ICON库 V0R2.
2019/1/12 GDP设计协同 超级管理员操作手册 GDP项目组.
数据挖掘工具性能比较.
Gender and Tenure Diversity in GitHub Teams
VSS使用简介 王树升
DevDays ’99 The aim of this mission is knowledge..
Developer Social Network
Feature and function introduction to GIT & Linux June 22, 2013
Github已有工作调研 邹卫琴 南京大学 , 南京.
GitHub挖掘已有工作调研 邹卫琴 南京大学 , 南京.
程序设计工具实习 Software Program Tool
Harvard ManageMentor®
何勉 新浪微博: Scrum框架及其背后的原则 原始图片 何勉 新浪微博:
《产品设计工程应用》课程 陈兴波 顺德职业技术学院/设计学院/工业设计专业.
第七章 研發計畫管理.
计算机及办公软件应用 ©2013 苏州工业园区职业技术学院
VisComposer 2019/4/17.
2019/4/ /4/25 学习科研好助手 NoteExpress文献管理与检索系统 北京爱琴海乐之技术有限公司.
实验七 安全FTP服务器实验 2019/4/28.
海南医学院附属医院 The Affiliated Hospital of Hainan Medical College 科研信息管理平台上线
计算机网络与网页制作 Chapter 07:Dreamweaver CS5入门
关于开源软件的几篇论文.
2.1 高職與私立學校註冊操作說明 (2015/9/15上線)
如何成为一名成功的研究生? 系列研讨会 张坤龙
GDP设计协同 项目创建者操作手册 GDP项目组 2019/01/30.
2019/5/10 网络学习空间实务操作.
魏新宇 MATLAB/Simulink 与控制系统仿真 魏新宇
Touch Github = Touch the World
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
翻转学习 穿越雾霾 ——小锐作业介绍.
GDP设计协同 项目经理操作手册 GDP项目组 2019/01/30.
格物资讯ICON发布 V0R3.
C++语言程序设计 C++语言程序设计 第一章 C++语言概述 第十一组 C++语言程序设计.
24 or 1024? PWN Jawbone Up24 手环.
本节内容 进程 视频提供:昆山爱达人信息技术有限公司 官网地址: 联系QQ: QQ交流群 : 联系电话:
FVX1100介绍 法视特(上海)图像科技有限公司 施 俊.
学习数据结构的意义 (C语言版) 《数据结构》在线开放课程 主讲人:李刚
第六讲 酒店客房管理系统(二) 教育部“十二五”职业教育国家规划教材
RefWorks使用指南 归档、管理个人参考文献.
IT 方法 INTOSAI IT 审计培训.
软件工程课程设计 分组信息说明
Presentation transcript:

收集Github中开源项目的数据,用于实验分析 如:评估领导者特征,研究其对项目成功的影响 Github中可以获得的信息 项目的选择

Github中的数据 项目 个人 组织 发起者,贡献者,参与者 受关注程度 代码及变更 问题报告及评论 基本信息 在项目中的活动记录 绩效:下载量,同类软件比较 团队成员社交关系:Cdlins, Clark 2003 (经常交流,独立高) 信任和沟通(组织氛围) 领导:业务能力 / 管理能力 (团队领导) 声誉 工作经验 组织的学习能力(资源齐备),老手带新手(培训) 社区的活动(Github,Facebook,Twitter)外部资本 年龄,受教育程度(Linked In) 知识产权保护,倒U型

Github项目 属主 项目名 关注者数 点赞数 克隆数

Github项目中的代码 提交数 每次提交: 开发者 提交时间 修改内容 附加消息 源代码 分支数 发布版本 贡献者 切换分支

Github项目中的Issues Issues:报告的问题 报告者,报告时间,报告内容 状态(open/closed) 分配的开发者 解决方式(fixed/invalid/won’t fix/..) 评论 评论者,评论时间,评论内容

Github项目中的Pull requests 包含的提交 修改的文件及内容 状态(是否接受) 分配的开发者 评论

人的信息 用户名,全名,加入时间,所属组织 粉丝,点赞的人,关注的人 创建项目,克隆项目,关注项目 活动: 组织:所属项目,成员 代码贡献:对某个项目进行某次提交 Issues/Pull Requests: 报告,处理,更改状态,评论 组织:所属项目,成员

数据获取 编写程序调用Github API 获得项目列表 逐个项目抽取所需数据保存 项目选择 过滤项目:活动少,参与者少

谢谢

Human Factor in Software Engineering 软件工程中人的因素对软件开发的影响 开源软件组织中的人 开发者网络 论文

开源软件 vs. 维基百科 修改及提交代码(修改提交百科词条) 管理人员审核,选择是否接受修改

开源软件项目 组织特性:扁平化,松散化,全球化, 人员流动大,依托于互联网进行合作 软件开发者:根据个人兴趣参与,选择 适合的任务和模块,自由安排时间,分 散于各个地理位置 项目管理者:吸取参与者的广泛意见, 需要评估参与者的水平和工作产品,选 择是否接受

开源软件项目开发过程 需求变更快,迭代周期短 每个开发周期会预先定义好任务目标, 管理人员安排一些开发者完成,这些开 发者大多为项目的长期贡献者 其他贡献者通常以问题报告的形式参与, 即便参与编写代码,也贡献不大

开源软件项目参与者的活动 修改提交代码 修改提交文档 报告问题 修复问题 参与讨论

数据收集 代码库:修改代码或文档 问题库: 跨项目 时间,文件,修改内容,相应问题编号 静态信息(报告者,类型,严重程度…) 动态信息(各属性变更情况) 跨项目 一个人在多个项目中的参与:Github

数据:基本关系 人 修改 文件 人 报告 问题 人 评论 问题 人 修复 问题 by 修改 文件

对开发者的衡量 贡献度大小 参与项目时间,关注点范围,参与频率, 效率,出错率 代码提交次数 代码修改行数 文件修改数 报告问题数 修复问题数 参与评论数 参与项目时间,关注点范围,参与频率, 效率,出错率

开发者网络 寻找软件开发中人与人之间的关系 典型方式 参与过同一个项目 修改过同一个文件 有过直接交流(Email) 评论过同一个问题

开发者网络的特性及应用 小世界:“六度分隔” 模块性:是否存在清晰的社区结构 团队结构:是否有核心人物 根据应用场景选择合适的构建方式 缺陷预测:基于共同修改关系构建开发者 网络,度量开发者的中心性,加入到缺陷 预测模型

协作模式挖掘

文献:软件工程中的组织行为学 Cocreating understanding and value in distributed work: how members of onsite and offshore vendor teams give, make, demand, and break sense Cognitive divergence and shared mental models in software development project teams Effective Work Practices for Software Engineering: Free/Libre Open Source Software Development The Influence of Organizational Structure on Software Quality: An Empirical Case Study 基于组织行为学的SW-KPA中人员行为模型 基于组织行为学的极限编程中的沟通准则

谢谢