数据库开发岗面试准备（2）——面试通用问题+python

2016-10-31 本文已影响340人是蓝先生

1.对于加班什么看法？
自己非常愿意XXXX

2.为什么选择金融这个行业？基金行业看法，以后想在这个行业里做什么？

（1）大学了解到金融的魅力，那种通过各种手法变魔术般进行资本的腾挪变幻的魅力。
（2）其次在暑期实习中发现很多比自己优秀的人，于是见贤思齐。
（3）不管时代怎么发展，各种产业都离不开金融，包括现在飞速发展的互联网。

（4）随着中国经济快速发展，社会财富逐步积累，投融资需求日益旺盛。最近几年的经济形式下银行衰败、券商也受行情影响较大，此时基金和资管公司承担起更大的责任。
最近几年公募和私募基金规模增速，而深港通、沪伦通等重大国际化举措也在加速落地，基金产品多样化发展（包括FOF），基金销售也出现了多元化发展格局。
（5）自己的职业规划是先用差不多五年来了解一个领域做到专且精，后面再去尝试和学习更多业务相关的新问题。

3.实习项目中的亮点
独立自主开发了两套财务报表，提升了工作效率

4.毕业论文写的什么？
《不完全信息下大群体多属性决策方法研究》

5.列举自己的三个缺点以及相比于其他人的优势？
缺点：1.易于承诺 2.工作中表达能力要加强提升效率
优势：具有技术基础，也具有财务知识，对于数据助理开发这个岗位特别需要

6.除了专业相关的书之外，还看了哪些方面的书？
（1）毛姆三部曲《刀锋》、《人生的枷锁》、《月亮与六便士》
还记得大学时候读《月亮与六便士》的震撼，觉得一个人就应该去追求自己喜欢的事情，功名利禄都是社会捆绑个体的绳索，会授予你一种生活方式、一份勇气。
《人生的枷锁》更多的是颠沛和迷茫，最终让人领悟回归日常的生活才是幸福的捷径。
（2）东野圭吾《白夜行》《嫌疑人X的献身》《解忧杂货铺》

7.为什么想来深圳？
因为深圳是个年轻有活力的城市，年轻人有更多发展机会的一座城市

8.问题，是否会有导师制度，带领了解学习

正能量+有想法+公司的发展方向

一、python建模和分析
关于利用python进行数据建模，数据来源可以是TuShare。TuShare是一个免费、开源的python财经数据接口包。主要实现对股票等金融数据从数据采集、清洗加工 到 数据存储的过程

TA系统结算岗：主要做的是估值完之后把数据拿过来算申购赎回的份额。

这一篇主要介绍在python的基础上实现逻辑回归等模型

这里是用python代码实现逻辑回归：
import matplotlib.pyplot as plt
from numpy import *

def loadDataSet():
    dataMat = [];
    labelMat = []
    fr = open('/Users/hakuri/Desktop/testSet.txt')
    for line in fr.readlines():
        lineArr = line.strip().split()
        dataMat.append([1.0, float(lineArr[0]), float(lineArr[1])])
        labelMat.append(int(lineArr[2]))
    return dataMat, labelMat


def sigmoid(inX):
    return 1.0 / (1 + exp(-inX))


def gradAscent(dataMatIn, classLabels):
    dataMatrix = mat(dataMatIn)  # convert to NumPy matrix
    labelMat = mat(classLabels).transpose()  # convert to NumPy matrix

    m, n = shape(dataMatrix)
    alpha = 0.001
    maxCycles = 500
    weights = ones((n, 1))

    for k in range(maxCycles):  # heavy on matrix operations
        h = sigmoid(dataMatrix * weights)  # matrix mult
        error = (labelMat - h)  # vector subtraction
        weights = weights + alpha * dataMatrix.transpose() * error  # matrix mult
    return weights


def GetResult():
    dataMat, labelMat = loadDataSet()
    weights = gradAscent(dataMat, labelMat)
    print
    weights
    plotBestFit(weights)


def plotBestFit(weights):
    dataMat, labelMat = loadDataSet()
    dataArr = array(dataMat)
    n = shape(dataArr)[0]
    xcord1 = [];
    ycord1 = []
    xcord2 = [];
    ycord2 = []
    for i in range(n):
        if int(labelMat[i]) == 1:
            xcord1.append(dataArr[i, 1]);
            ycord1.append(dataArr[i, 2])
        else:
            xcord2.append(dataArr[i, 1]);
            ycord2.append(dataArr[i, 2])
    fig = plt.figure()
    ax = fig.add_subplot(111)
    ax.scatter(xcord1, ycord1, s=30, c='red', marker='s')
    ax.scatter(xcord2, ycord2, s=30, c='green')
    x = arange(-3.0, 3.0, 0.1)
    y = (0.48 * x + 4.12414) / (0.616)
    #     y = (-weights[0]-weights[1]*x)/weights[2]
    ax.plot(x, y)
    plt.xlabel('X1');
    plt.ylabel('X2');
    plt.show()


if __name__ == '__main__':
    GetResult()

二、python解析pdf文件内容

（来源：https://www.zhihu.com/question/31586273/answer/113518895）

将 PDF 转化为纯文本格式
抽取其中部分内容
格式化写入到 excel 中

转换 PDF有pyPDF和PDFMiner，因为据说PDFMiner更适合文本的解析，而自己需要解析的正是文本。如下是通过 pdfMiner 的示例：

from cStringIO import StringIO

from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import TextConverter
from pdfminer.layout import LAParams
from pdfminer.pdfpage import PDFPage


def convert_pdf_2_text(path):
    rsrcmgr = PDFResourceManager()
    retstr = StringIO()

    device = TextConverter(rsrcmgr, retstr, codec='utf-8', laparams=LAParams())
    interpreter = PDFPageInterpreter(rsrcmgr, device)

    with open(path, 'rb') as fp:
        for page in PDFPage.get_pages(fp, set()):
            interpreter.process_page(page)
        text = retstr.getvalue()

    device.close()
    retstr.close()

    return text

数据库开发岗面试准备（2）——面试通用问题+python

猜你喜欢

热点阅读